北京智谱华章科技有限公司谌业林获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京智谱华章科技有限公司申请的专利命名实体识别方法和命名实体识别模型构建方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119416788B 。
龙图腾网通过国家知识产权局官网在2026-03-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411542798.2,技术领域涉及:G06F40/295;该发明授权命名实体识别方法和命名实体识别模型构建方法是由谌业林;张帆进;张鹏设计研发完成,并于2024-10-31向国家知识产权局提交的专利申请。
本命名实体识别方法和命名实体识别模型构建方法在说明书摘要公布了:本公开实施例提供一种命名实体识别方法和命名实体识别模型构建方法。命名实体识别方法包括:采用双仿射网络处理所述编码特征张量,得到初始融合张量;采用包括第一注意力机制网络和第二注意力机制网络初始融合张量进行处理,得到最终融合张量;采用预测网络处理所述最终融合张量,得到识别命名实体,所述识别命名实体是其中最小语义单元正向排序的命名实体。本公开实施例提供的命名实体识别方法在处理嵌套实体和跨句实体块方面表现出色,克服了现有技术在识别复杂文本结构的局限,显著提升了对复杂文本中命名实体的识别能力。
本发明授权命名实体识别方法和命名实体识别模型构建方法在权利要求书中公布了:1.一种命名实体识别方法,其特征在于,包括: 采用编码网络对待识别文本进行编码处理,得到编码特征张量,所述编码特征张量包括按照所述待识别文本中各个最小语义单元排序并且对应各个所述最小语义单元的编码张量; 采用双仿射网络处理所述编码特征张量,得到以各个最小语义单元作为起始语义单元和结束语义单元的所有候选命名实体关联的表征张量,并对各个候选命名实体对应的表征张量进行二维排序组合,得到初始融合张量;其中所述二维排序包括按照各个最小语义单元在所述待识别文本中的顺序,以各个最小语义单元作为候选命名实体的起始语义单元并且使得各个候选命名实体包括的最小语义单元数量顺次变化为约束在第一维度上对所述表征张量进行排序,以各个最小语义单元作为候选命名实体的结束语义单元并且使得各个候选命名包括的最小语义单元数量顺次变化作为约束在第二维度上对所述表征张量进行排序; 循环执行如下S1-S3,直至得到最终融合张量,其中各次循环中使用的第一注意力机制网络、第二注意力机制网络不相同: S1:采用第一注意力机制网络对具有相同起始语义单元的候选命名实体在所述初始融合张量中关联的表征张量或者在中间融合张量中关联的再表征张量进行注意力机制计算,得到与各个候选命名实体关联的第一聚合张量;以及,采用第二注意力机制网络对具有相同结束语义单元的候选命名实体在所述初始融合张量中关联的表征张量或者在中间融合张量中关联的再表征张量进行注意力机制计算,得到与各个候选命名实体关联的第二聚合张量; S2:对各个候选命实体对应的第一聚合张量和第二聚合张量进行再聚合,得到再表征张量; S3:按照所述二维排序的排序策略重新对各个候选命名实体对应的再表征张量进行组合,得到中间融合张量或者所述最终融合张量; 采用预测网络处理所述最终融合张量,得到识别命名实体,所述识别命名实体是其中最小语义单元正向排序的命名实体; S3包括:按照所述二维排序的排序策略重新对各个候选命名实体对应的再表征张量进行组合,得到组合张量;采用卷积神经网络处理所述组合张量,得到卷积处理后的再表征张量;采用卷积处理后得到的再表征张量按照所述二维排序的排序策略组合形成所述中间融合张量或者所述最终融合张量;其中,各次循环执行S3过程中采用的所述卷积神经网络不同。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京智谱华章科技有限公司,其通讯地址为:100086 北京市海淀区中关村东路1号院9号楼10层整层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励