厦门市美亚柏科信息股份有限公司陈毓靖获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉厦门市美亚柏科信息股份有限公司申请的专利一种实体关系抽取模型生成方法及实体关系抽取方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116011453B 。
龙图腾网通过国家知识产权局官网在2025-10-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211641148.4,技术领域涉及:G06F40/295;该发明授权一种实体关系抽取模型生成方法及实体关系抽取方法是由陈毓靖;朱海勇;罗雅英;陈吉洪;戴亨波;张伟烽设计研发完成,并于2022-12-20向国家知识产权局提交的专利申请。
本一种实体关系抽取模型生成方法及实体关系抽取方法在说明书摘要公布了:本申请涉及一种实体关系抽取模型生成方法及实体关系抽取方法,本申请使用比实际部署时要求长度更长的长度作为最大长度进行自适应多阶段的训练,由于训练模型时的最大长度自适合选择,且更长,所以模型具有更高效的语义能力;而当部署时使用比训练的最大长度小的文本作为输入时,模型的能力能有更好的表现。实际测试中发现改进后的训练策略使模型在多份相同数据集中都有F1提升3个点。
本发明授权一种实体关系抽取模型生成方法及实体关系抽取方法在权利要求书中公布了:1.一种实体关系抽取模型生成方法,其特征在于:所述方法包括以下步骤: S101:按部署时输入文本的最大长度H的12倍作为训练的最大长度来制作训练集D1,然后在训练集D1上训练模型,训练收敛后得到模型M1;如果训练集中单条文本过长则将文本切开; 所述将文本切开的操作为:假设长句长度为h1,要切分为的短句的长度为h2,切分的步骤为:从长句第一个字符往后找到第h2个字符,然后从此字符开始再往前找句子的间隔符,找到的间隔符的位置就是要切开的第一个位置;如果从此字符开始往前未找到间隔符,则强制从此字符处切开;然后以此切开位置为句首重复上述步骤,直到往后找的句子长度不满足h1,则停止; S102:按部署时最大长度H的1倍作为训练的最大长度来制作训练集D2,在D2训练集上以S1中的模型M1为模型基础参数进行fintune训练,得到模型M2; S103:按部署时最大长度H的2倍作为训练的最大长度来制作训练集D3,在D3训练集上以S2中的模型M2为模型基础参数,进行fintune训练,得到最终的实体关系抽取模型M3。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人厦门市美亚柏科信息股份有限公司,其通讯地址为:361000 福建省厦门市思明区软件园二期观日路12号102-402单元;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励