重庆邮电大学唐宏获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉重庆邮电大学申请的专利一种基于长尾问题的多标签文本分类方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115757795B 。
龙图腾网通过国家知识产权局官网在2026-03-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211519636.8,技术领域涉及:G06F16/353;该发明授权一种基于长尾问题的多标签文本分类方法是由唐宏;刘杰;甘陈敏;彭金枝;孙锐设计研发完成,并于2022-11-30向国家知识产权局提交的专利申请。
本一种基于长尾问题的多标签文本分类方法在说明书摘要公布了:本发明属于自然语言处理与多标签文本分类领域,特别涉及一种基于长尾问题的多标签文本分类方法,包括对头部标签和尾部标签进行文本语义提取,分别获得头部标签文本表示和尾部标签文本表示并进行采样,得到头部标签原型和尾部标签原型;利用头部标签文本表示训练得到头部标签分类器,通过最小化头部标签分类器的损失函数,得到头部标签权重;将头部标签原型映射到头部标签权重上,通过最小化迁移学习获取转移权重;根据转移权重对头部标签权重进行转移,得到尾部标签分类器;将尾部标签分类器和头部标签分类器进行融合,得到分类模块;将待分类数据的文本表示输入分类模块,得到分类结果;本发明提升多标签文本分类的准确率和归一化折损累计增益。
本发明授权一种基于长尾问题的多标签文本分类方法在权利要求书中公布了:1.一种基于长尾问题的多标签文本分类方法,其特征在于,构建包括文本语义提取模块、权重转移模块、融合模块以及分类模块的文本分类模型,进行分类的过程包括以下步骤: S1、文本语义提取模块通过Bert、BILSTM以及注意力机制对头部标签和尾部标签进行文本语义提取,分别获得头部标签文本表示和尾部标签文本表示;获取文本表示的过程包括: 采用Bert模型对文本进行预训练,得到预训练文本表示; 通过BILSTM获取预训练文本表示的文本上下文依赖关系; 利用注意力机制对文本上下文依赖关系进行强化,得到文本表示; S2、对头部标签文本表示和尾部标签文本表示分别进行采样,得到头部标签原型和尾部标签原型; S3、利用头部标签文本表示对头部标签分类器进行训练,获取头部标签分类器,通过最小化头部标签分类器的损失函数,得到头部标签权重;头部标签分类器包括一层Sigmoid激活函数,文本表示输入头部标签分类器,将交叉熵损失函数作为头部标签分类器的损失函数,通过最小化损失函数求得头部标签的权重,表示为: 其中,为头部标签分类器预测得到的分类结果,为文本表示,表示头部分类器的权重,表示头标签对应的标签数量,表示第i个文本,表示头部标签对应文本的集合,表示第i个文本对应第j个头部标签的预测概率,表示第i个文本对应第j个头部标签的实际概率,loss表示损失函数; S4、权重转移模块将头部标签原型映射到头部标签权重上,并通过最小化迁移学习获取转移权重; S4、权重转移模块根据转移权重对头部标签权重进行转移,得到尾部标签分类器;尾部标签分类器的构建过程包括以下步骤: 获取第i个头部标签对第j个尾部标签相关性的线性组合,表示为: ; 利用注意力机制对第i个头部标签对第j个尾部标签相关性的线性组合进行处理,并对第i个头标签原型进行加权,得到第j个尾部标签的新原型,表示为: 第j个尾部标签的新原型通过转移矩阵得到其对应的尾部标签分类器,表示为: ; 其中,表示头标签对尾标签的线性原型组合,表示第i个头标签原型,表示第j个尾标签原型;表示加性注意力机制处理后的头标签与尾标签相关性,表示注意力权重,表示注意力分数,表示第j个头标签的注意力原型,avg表示求取向量的均值,表示第j个尾部标签的新原型;表示转移权重矩阵,表示第j个标签的尾部标签分类器权重; S5、融合模块将尾部标签分类器和头部标签分类器进行融合,得到分类模块; S6、将待分类数据的文本表示输入分类模块,得到分类结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人重庆邮电大学,其通讯地址为:400065 重庆市南岸区南山街道崇文路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励