恭喜国家电网有限公司大数据中心刘俊健获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜国家电网有限公司大数据中心申请的专利一种实体关系抽取方法、装置、设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115544273B 。
龙图腾网通过国家知识产权局官网在2025-06-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211324149.6,技术领域涉及:G06F16/36;该发明授权一种实体关系抽取方法、装置、设备及存储介质是由刘俊健;李博;朱天佑;刘普凡;李继伟;陈振宇;边靖宸;吕宏伟;郑飞;陈飞;江丽娜设计研发完成,并于2022-10-27向国家知识产权局提交的专利申请。
本一种实体关系抽取方法、装置、设备及存储介质在说明书摘要公布了:本发明公开了一种实体关系抽取方法、装置、设备及存储介质。通过将句子样本集输入初始实体关系抽取模型得到至少一个第一实体关系集群,以及第一实体关系集群所包含的句子样本的伪标签;根据具有伪标签的句子样本更新句子样本集,将更新后的句子样本集输入初始实体关系抽取模型得到至少一个第二实体关系集群,以及第二实体关系集群所包含的句子样本的预测标签;根据句子样本对应的伪标签和预测标签计算损失函数值,并基于损失函数值对初始实体关系抽取模型中的网络参数进行迭代调整,得到目标实体关系抽取模型,能够实现无需人工标记的实体关系抽取方法。
本发明授权一种实体关系抽取方法、装置、设备及存储介质在权利要求书中公布了:1.一种实体关系抽取模型的训练方法,其特征在于,包括:将句子样本集输入初始实体关系抽取模型,其中,所述关系抽取模型包括:预训练的关系编码模块和聚类模块;所述句子样本集由未标记的句子样本构成;通过所述关系编码模块对所述句子样本集中的句子样本进行实体关系预测得到实体关系图,将所述实体关系图输入所述聚类模块;通过所述聚类模块基于所述实体关系图中的实体之间的相似度进行聚类得到至少一个第一实体关系集群,以及所述第一实体关系集群所包含的句子样本的伪标签;其中,同一第一实体关系集群所包含的句子样本标记有相同的伪标签;根据具有伪标签的句子样本更新所述句子样本集,将更新后的句子样本集输入所述初始实体关系抽取模型得到至少一个第二实体关系集群,以及所述第二实体关系集群所包含的句子样本的预测标签;根据所述句子样本对应的伪标签和预测标签计算损失函数值,并基于所述损失函数值对所述初始实体关系抽取模型中的网络参数进行迭代调整,得到目标实体关系抽取模型;基于所述损失函数值对所述初始实体关系抽取模型中的网络参数进行迭代调整,得到目标实体关系抽取模型,包括:基于所述损失函数值对所述初始实体关系抽取模型中的网络参数进行调整;将所述句子样本的预测标签确定为所述句子样本的伪标签;返回执行根据具有伪标签的句子样本更新所述句子样本集,将更新后的所述句子样本集输入所述初始实体关系抽取模型得到至少一个第二实体关系集群的步骤;直到所述损失函数值为最小值时,将所述损失函数值对应的初始实体关系抽取模型确定为目标实体关系抽取模型。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人国家电网有限公司大数据中心,其通讯地址为:100031 北京市西城区宣武门内大街8号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。