深圳计算科学研究院王尧舒获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉深圳计算科学研究院申请的专利用于实体链接的跨领域实体识别方法、装置、设备及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119760034B 。
龙图腾网通过国家知识产权局官网在2025-10-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411938987.1,技术领域涉及:G06F16/28;该发明授权用于实体链接的跨领域实体识别方法、装置、设备及介质是由王尧舒;晏梦懿;谢珉设计研发完成,并于2024-12-26向国家知识产权局提交的专利申请。
本用于实体链接的跨领域实体识别方法、装置、设备及介质在说明书摘要公布了:本申请适用于大数据挖掘技术领域,尤其涉及一种用于实体链接的跨领域实体识别方法、装置、设备及介质。该方法通过对源数据和目标数据的嵌入式表示来预训练得到表示模型,再通过数据扩展和增强的方式构建监督训练样本和自监督训练的样本,分别使用监督训练和自监督训练对上述的表示模型进行优化训练,从而为目标领域的数据识别提供准确地表达模型,可以应多不同领域的数据的实体识别,从而提高实体链接任务的自适应能力。
本发明授权用于实体链接的跨领域实体识别方法、装置、设备及介质在权利要求书中公布了:1.一种用于实体链接的跨领域实体识别方法,其特征在于,所述跨领域实体识别方法包括: 获取源领域的源数据和目标领域的目标数据,使用初始的表示模型对源数据和目标数据进行嵌入,得到源嵌入表示和目标嵌入表示,以所述源嵌入表示和所述目标嵌入表示对齐为目标,对所述表示模型进行对抗学习训练,得到预训练好的表示模型,其中,在文本分类场景中,所述源数据为第一语言数据,所述目标数据为第二语言数据; 在所述源领域,对所述源数据进行属性扩展,得到对应所述源数据的源扩展数据,将源扩展数据与对应源数据的标签关联,得到第一监督训练样本; 在所述目标领域,对所述目标数据进行属性扩展,得到对应所述目标数据的目标扩展数据,对目标扩展数据进行增强,得到增强的目标数据,对所述增强的目标数据进行伪标签构建,得到对应的伪标签,将所述增强的目标数据与对应的伪标签关联,得到第二监督训练样本; 使用所述第一监督训练样本和所述第二监督训练样本,对所述预训练好的表示模型进行监督对比学习训练,并使用所述增强的目标数据,对所述预训练好的表示模型进行自监督对比学习训练,得到训练好的表示模型; 使用所述训练好的表示模型,对所述目标领域的待识别数据进行嵌入,得到待识别嵌入表达,根据所述待识别嵌入表达,对所述待识别数据进行实体链接; 所述在所述源领域,对所述源数据进行属性扩展,得到对应所述源数据的源扩展数据,包括: 将所述源数据和对应所述源数据的基本属性集输入大语言模型,使能所述大语言模型根据第一预设指令生成第一候选属性集; 获取所述第一候选属性集中每个属性的属性频率,从所述第一候选属性集中将属性频率大于预设频率或者属性频率无效的属性过滤,得到第一过滤属性集; 基于归一化互信息评价指标,从所述第一过滤属性集筛选出第一扩展属性子集,使用所述第一扩展属性子集对所述源数据进行属性扩展,得到对应所述源数据的源扩展数据。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人深圳计算科学研究院,其通讯地址为:518000 广东省深圳市龙华区民治街道红山六九七九商业中心(二期)9栋26座1001;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励