首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种多维特征融合的桥梁康养领域实体对齐方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:安徽省交通规划设计研究总院股份有限公司;重庆交通大学;安徽省交规院工程智慧养护科技有限公司

摘要:本发明公开了一种多维特征融合的桥梁康养领域实体对齐方法,收集实体名称、本体概念、概念描述、属性值、知识三元组相关数据,构建该领域实体对齐语料库,进一步构建多维特征融合的桥梁康养领域实体对齐模型,通过领域词嵌入捕获浅层语义,文本嵌入捕获深层语义,三元组嵌入捕获结构特征,并计算目标实体相关特征在相同向量空间下的语义相似度,设置可学习的自适应权重超参数实现实体对间的多维特征融合,得到最终的实体对综合语义相似度结果。本发明将领域词嵌入、文本嵌入与知识三元组嵌入方法相结合,同时保留了领域实体对间的浅层语义特征、深层语义特征以及在结构上的关联,进一步提高了模型的性能和领域适应性。

主权项:1.一种多维特征融合的桥梁康养领域实体对齐方法,其特征在于,包括:S1、收集实体名称、本体概念、概念描述、属性值、三元组相关数据,构建该领域实体对齐语料库;S2、构建包括领域词嵌入模块、文本嵌入模块与三元组嵌入模块的多维特征融合的桥梁康养领域实体对齐模型;领域词嵌入模块采用word2vec-CBOW词嵌入模型进行领域词向量训练,得到领域词典;文本嵌入模块将实体名称、本体概念、概念描述、属性值进行拼接作为该模块的输入,此外,该模块采用chinese-bert-wwm-ext预训练语言模型进行长距离的文本特征编码;三元组嵌入模块采用TransH模型对头实体、关系,尾实体间的结构信息进行向量化表征;所述的桥梁康养领域实体对齐模型中的领域词嵌入xcbow={xe,xo,xod,xa}=CBOW{ce,co,cod,ca};其中{ce,co,cod,ca}分别为桥梁康养实体名称,本体概念,概念描述和属性所对应的文本字符串,{xe,xo,xod,xa}为桥梁康养实体名称,本体概念,概念描述和属性所对应的字符串向量序列;文本嵌入模块的输出为其中,xe,xo,xod,xa为实体名称、本体概念、概念描述、属性值拼接后的向量序列;三元组嵌入模块的输出为其中,eh,r,et为头实体、关系和尾实体组成的关系三元组;S3、通过领域词嵌入捕获浅层语义,文本嵌入捕获深层语义,三元组嵌入捕获结构特征,并计算目标实体相关特征在相同向量空间下的语义相似度;S3中的不同特征嵌入模块采用了不同的语义相似度计算模型;其中,领域词嵌入模块和文本嵌入模块采用欧式距离distx1,x2计算语义相似度,三元组嵌入模块采用余弦相似度cosx1,x2计算实体对间的结构距离;所述的领域词嵌入模块的语义相似度sim1为实体名称、本体概念、概念描述、属性值相似度的加权平均,其计算公式如下:sim1=αe*sime+αo*simo+αod*simod+αat*simat 本体概念相似度simo,概念描述相似度simod,属性值相似度simat的计算方法与实体名称相似度sime类似,其中,αe,αo,αod,αat为模型训练过程中需要学习的关于实体名称、本体概念、概念描述、属性值的相似度权重;文本嵌入模块的语义相似度三元组嵌入模块的语义相似度S4、设置可学习的自适应权重超参数实现实体对间的多维特征融合,得到最终的实体对综合语义相似度结果。

全文数据:

权利要求:

百度查询: 安徽省交通规划设计研究总院股份有限公司 重庆交通大学 安徽省交规院工程智慧养护科技有限公司 一种多维特征融合的桥梁康养领域实体对齐方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。