Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 北京中科闻歌科技股份有限公司;中国科学院自动化研究所;航空工业信息中心王婧宜获国家专利权

北京中科闻歌科技股份有限公司;中国科学院自动化研究所;航空工业信息中心王婧宜获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉北京中科闻歌科技股份有限公司;中国科学院自动化研究所;航空工业信息中心申请的专利一种融合知识的低资源语种实体抽取系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115828917B

龙图腾网通过国家知识产权局官网在2025-11-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211505312.9,技术领域涉及:G06F40/295;该发明授权一种融合知识的低资源语种实体抽取系统是由王婧宜;王磊;俞笑;罗引;禹宁;孔庆超;冯昊;曹家;王艳杰;王璋盛;徐楠;王童跃设计研发完成,并于2022-11-28向国家知识产权局提交的专利申请。

一种融合知识的低资源语种实体抽取系统在说明书摘要公布了:本发明提供了一种融合知识的低资源语种实体抽取系统,包括:目标语种知识库、关联语种知识库、处理器和存储有计算机程序的存储器,当处理器执行计算机程序时,实现如下步骤:获取无标注语料目标语句中的目标实体,将目标实体与目标语种知识库、关联语种知识库进行实体链接,以预测掩码实体为目标获取第一损失函数,以预测实体的上下文为目标获取第二损失函数,以预测实体类型为目标获取第三损失函数,通过最小化三个损失函数的加权求和函数,获取XLM‑RK模型;从而根据XLM‑RK模型在预训练阶段获得的跨语言实体对齐能力,提升目标语种实体识别效果。

本发明授权一种融合知识的低资源语种实体抽取系统在权利要求书中公布了:1.一种融合知识的低资源语种实体抽取系统,其特征在于,所述系统包括目标语种知识库、关联语种知识库、处理器和存储有计算机程序的存储器,所述关联语种为与目标语种同一语系的语种或与目标语种具有重合度的语种,且所述关联语种为高资源语种,当处理器执行计算机程序时,实现如下步骤: S100,获取无标注语料目标语句中的目标实体; S200,将目标实体与目标语种知识库、关联语种知识库进行实体链接,获取目标实体对应的第一实体,其中,所述第一实体是目标语种知识库和关联语种知识库中与目标实体对应的实体; S300,基于第一实体知识短句列表Z={Z1,Z2,…,Zi,…,Zm}和第一中间语句X0构建第一训练语料集X={X1,X2,…,Xi,…,Xm},其中,第i个第一训练语料Xi通过将X0拼接在Zi之后得到;Zi为第一实体对应的第i个三元组根据第一预设语法规则构建的语句,i的取值范围是1到m,m是指第一实体对应的目标语种和关联语种三元组的数量,第一中间语句X0是对目标语句按照第一掩码规则进行实体掩码后的语句; S400,将第一训练语料集X输入XLM-R模型,以预测掩码实体为目标获取第一损失函数L1; S500,基于第二实体知识短句列表Y={Y1,Y2,…,Yj,…,Yn}和第二中间语句X′构建第二训练语料集P={P1,P2,…,Pj,…,Pn},其中,n是在目标语种知识库中和目标实体匹配、且对应三元组符合isA关系的三元组的数量,Yj是目标语种知识库中和目标实体匹配、且对应三元组符合isA关系的第j个三元组根据第二预设语法规则构建的语句,j的取值范围为1到n,第二中间语句X′是对目标语句按照第二掩码规则进行非实体掩码后的语句; S600,将第二训练语料集P输入XLM-R模型,以预测实体的上下文为目标获取第二损失函数L2; S700,基于第三实体知识短句A0和目标语句进行拼接,构建第三训练语料B,其中,A0是Y中一满足预设过滤规则的第二实体知识短句按照第三掩码规则对isA关系对应的尾实体进行掩码后的语句; S800,将第三训练语料B输入XLM-R模型,根据预设候选实体类型集以预测实体类型为目标获取第三损失函数L3; S900,通过最小化损失函数L=αL1+βL2+γL3,将满足预设损失条件的XLM-R模型标记为XLM-RK模型,其中,α、β、γ均为预设权重参数。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京中科闻歌科技股份有限公司;中国科学院自动化研究所;航空工业信息中心,其通讯地址为:100190 北京市海淀区北四环西路9号楼7层717室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。