西安电子科技大学刘怀亮获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉西安电子科技大学申请的专利一种基于RoBERTa模型的农情实体链接方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118708829B 。
龙图腾网通过国家知识产权局官网在2025-04-22发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410858180.0,技术领域涉及:G06F16/955;该发明授权一种基于RoBERTa模型的农情实体链接方法是由刘怀亮;赵舰波;李洁;张善庄;张毅设计研发完成,并于2024-06-28向国家知识产权局提交的专利申请。
本一种基于RoBERTa模型的农情实体链接方法在说明书摘要公布了:本发明公开了一种基于RoBERTa模型的农情实体链接方法,其包括:识别目标文本中的目标实体,并从目标文本中提取表达目标实体的实体提及以及实体提及的上下文,根据实体提及以及上下文构建第一文本;将第一文本输入至第一RoBERTa模型中进行文本嵌入,得到第一嵌入向量;将n个第二文本输入至第二RoBERTa模型中进行文本嵌入得到n个第二嵌入向量;计算第一嵌入向量与n个第二嵌入向量的相似度,并确定与第一嵌入向量的相似度最高的k个第二嵌入向量,将k个第二嵌入向量对应的k个实体作为k个候选实体,并基于k个候选实体进行实体消歧,得到目标候选实体;将目标实体的实体提及链接至知识图谱中的目标候选实体。本发明提高了实体链接的准确性。
本发明授权一种基于RoBERTa模型的农情实体链接方法在权利要求书中公布了:1.一种基于RoBERTa模型的农情实体链接方法,其特征在于,包括:识别目标文本中的目标实体,并从所述目标文本中提取表达所述目标实体的实体提及以及所述实体提及的上下文,根据所述实体提及以及所述上下文构建第一文本;将所述第一文本输入至第一RoBERTa模型中进行文本嵌入,得到第一嵌入向量;将n个第二文本输入至第二RoBERTa模型中进行文本嵌入得到n个第二嵌入向量;计算所述第一嵌入向量与所述n个第二嵌入向量的相似度,并确定与所述第一嵌入向量的相似度最高的k个第二嵌入向量;所述n个第二文本与知识图谱中所有的n个实体一一对应,每个第二文本均是根据其所对应的实体在所述知识图谱中的标题及描述构建而成;将所述k个第二嵌入向量对应的k个实体作为k个候选实体,并基于所述k个候选实体进行实体消歧,得到目标候选实体;将所述目标实体的所述实体提及链接至知识图谱中的所述目标候选实体;所述第一RoBERTa模型是根据多个第一文本样本训练得到的,所述第二RoBERTa模型是根据多个第二文本样本训练得到的;所述基于所述k个候选实体进行实体消歧,得到目标候选实体,包括:获取所述k个候选实体对应的k个第二文本,根据所述第一文本与所述k个第二文本中的每个第二文本,均构建一个第三文本,得到k个第三文本;将所述k个第三文本输入至第三RoBERTa模型中进行文本嵌入,得到k个第三嵌入向量;所述第三RoBERTa模型是根据多个第三文本样本训练得到的;根据所述k个第三嵌入向量对应计算k个得分,作为所述k个候选实体的得分;选取得分最高的候选实体作为所述目标候选实体;所述第三RoBERTa模型是历经多个训练周期的训练得到的,每个训练周期中的训练方式如下:从所述多个第三文本样本中,选取未参与过训练的一个第三文本样本输入至训练中的第三RoBERTa模型,得到一个第三嵌入向量;将得到的第三嵌入向量输入至Softmax函数计算概率值;根据所述概率值与所选取的第三文本样本的标签计算第二损失值;若所述第二损失值不小于预设的阈值,调整当前的第三RoBERTa模型的网络权重参数,然后进入下一个训练周期;若所述第二损失值小于所述阈值,结束训练,得到训练完成的第三RoBERTa模型。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西安电子科技大学,其通讯地址为:710071 陕西省西安市雁塔区太白南路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。