阿里巴巴(中国)有限公司丁宁获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉阿里巴巴(中国)有限公司申请的专利训练实体类型识别模型的方法、实体类型识别方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116304014B 。
龙图腾网通过国家知识产权局官网在2026-03-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211563437.7,技术领域涉及:G06F16/353;该发明授权训练实体类型识别模型的方法、实体类型识别方法及装置是由丁宁;王潇斌;徐光伟;谢朋峻;郑海涛设计研发完成,并于2022-12-07向国家知识产权局提交的专利申请。
本训练实体类型识别模型的方法、实体类型识别方法及装置在说明书摘要公布了:本申请实施例公开了一种训练实体类型识别模型的方法、实体类型识别方法及装置,涉及深度学习技术领域。其中实体类型识别方法包括:获取待识别文本;利用待识别文本中的实体词生成提示文本;利用待识别文本和提示文本得到输入文本序列输入实体类型识别模型,实体类型识别模型包括预测网络和基于预训练语言模型的编码网络,其中,编码网络提取输入文本序列中各元素的特征表示;预测网络利用各元素的特征表示,预测提示文本中被掩码的内容在词表中各词语上的概率分布,依据概率分布得到待识别文本中的实体词对应的实体类型,词表包括各实体类型对应的标签词。本申请能够提高实体类型识别模型的识别效果。
本发明授权训练实体类型识别模型的方法、实体类型识别方法及装置在权利要求书中公布了:1.一种训练实体类型识别模型的方法,其特征在于,所述方法包括: 获取包括多个训练样本的训练数据,所述训练样本包括文本样本以及所述文本样本中实体词被标注的实体类型标签; 利用所述训练数据训练实体类型识别模型,所述实体类型识别模型包括预测网络和基于预训练语言模型的编码网络;所述训练包括: 利用文本样本中的实体词生成提示文本,所述提示文本包含所述文本样本中的实体词以及被掩码内容;利用文本样本以及提示文本得到输入文本序列,将所述文本输入序列输入所述编码网络,由所述编码网络提取所述输入文本序列中各元素的特征表示;所述预测网络利用所述各元素的特征表示,预测所述提示文本中被掩码的内容在词表中各词语上的概率分布,依据所述概率分布得到所述文本样本中的实体词对应的实体类型,所述词表包括各实体类型对应的标签词;训练目标包括:最小化所述编码网络得到的所述文本样本中的实体词对应的实体类型与所述文本样本中的实体词被标注的实体类型标签之间的差异; 其中,所述特征表示包括词向量表示和位置的表示,所述由所述编码网络提取所述输入文本序列中各元素的特征表示,包括:对所述元素进行词向量编码,得到所述元素的所述词向量表示,以及将所述元素在所述输入文本序列中的位置进行编码,得到所述元素的所述位置的表示; 其中,所述词表为利用各实体类型对应的标签词及所述标签词的同义词预先构建得到。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人阿里巴巴(中国)有限公司,其通讯地址为:311121 浙江省杭州市余杭区五常街道文一西路969号3幢5层554室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励