中国人民解放军军事科学院军事科学信息研究中心薛非获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国人民解放军军事科学院军事科学信息研究中心申请的专利一种基于标签语义学习和注意力调整机制的文本分类方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115221325B 。
龙图腾网通过国家知识产权局官网在2026-02-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210877997.3,技术领域涉及:G06F16/35;该发明授权一种基于标签语义学习和注意力调整机制的文本分类方法是由薛非;李晓松;高强;赵彦飞;刘奇林设计研发完成,并于2022-07-25向国家知识产权局提交的专利申请。
本一种基于标签语义学习和注意力调整机制的文本分类方法在说明书摘要公布了:本发明公开了一种基于标签语义学习和注意力调整机制的文本分类方法,所述文本分类方法主要包括以下步骤:对文本数据进行预处理,提取文本语义特征,文本标签图嵌入,使用多头调节注意机制来衡量词与标签之间的语义关系,然后多语义整合融合和网络训练,由此可实现多标签文本分类,对模型进行训练,然后使用训练后的模型预测一段文本的类别。本发明提出一种多头调整注意的混合BERT模型用于多标签文本分类框架,可以有效地从文本内容中提取有用的特征,并建立标签和单词之间的语义联系,获得特定于标签的单词表示,由此提高多标签文本分类性能。
本发明授权一种基于标签语义学习和注意力调整机制的文本分类方法在权利要求书中公布了:1.一种基于标签语义学习和注意力调整机制的文本分类方法,所述文本为多标签文本,其特征在于,所述文本分类方法包括以下步骤: 1数据进行预处理,使用WordPiece分词器对文本进行分词并将所有字符小写,同时将每个文本表示为若干个tokens;对标签所有字符小写; 2提取文本语义特征,对多标签文本数据分别进行编码得到相应的特征表示,对于数据中的文本,使用单词嵌入模块,将原始单词嵌入到低维向量中,可以得到文本语义特征;使用预训练的BERT模型计算每个单词的上下文感知表示,为不同上下文中的单词生成不同的嵌入词;BERT接受序列形式的输入,并输出序列的表示形式,得到最终文本的语义特征表示; 3文本标签图嵌入,对每个文本对应的标签,利用标签图来反映标签结构,将每个标签视为一个节点,每个节点收集所有邻居的特征以形成其表示,每条边反映了节点之间的语义相关性,如果标签共存,就有一条边,最终得到一个低维的潜在空间中表示标签图; 4使用多头注意力调节机制来衡量词与标签之间的语义关系,获得特定于标签的单词表示,并对文档中重要的细粒度语义信息进行加权; 5多语义整合融合和网络训练,使用双向长短期记忆网络Bi-LSTM作为文档编码器,结合上下文感知特征和标签特殊词汇特征的混合表示被送入文档编码器进行分类,开始训练整个模型,实现多标签文本分类。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国人民解放军军事科学院军事科学信息研究中心,其通讯地址为:100000 北京市海淀区阜成路26号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励