首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于真-伪三连体神经网络的本体匹配方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:兰州理工大学

摘要:本发明公开了一种基于真‑伪三连体神经网络的本体匹配方法,步骤如下:从待匹配本体中提取核心实体集;利用混合相似度度量方法构建训练数据集;对训练数据集进行字符嵌入,得到字符向量;将字符向量送入真‑伪三连体神经网络中进行模型训练;对验证数据集进行匹配;对匹配结果进行评估。本发明能够同时通过SNN和PSNN对本体中的同类以及异类注释属性进行语义学习,得到的语义特征更能全面表示实体的语义信息,有效促进了本体匹配结果质量的提高,很好地解决了现有的本体匹配方法无法全面学习本体的语义信息、导致得到的语义特征并不能有效代表实体的语义信息、进而造成匹配结果的质量无法满足实际基于本体的智能系统间交互要求的问题。

主权项:1.一种基于真-伪三连体神经网络的本体匹配方法,其特征在于,包括以下步骤:S1:给定待匹配本体,从待匹配本体中提取各自具有代表性的实体,得到核心实体集,用于构建训练数据集;S2:构建训练数据集;S3:对训练数据集进行字符嵌入,将字符转化为可供计算机识别的字符向量;S4:将编码好的字符向量送入真-伪三连体神经网络中进行模型训练;所述真-伪三连体神经网络采用两个循环神经网络RNN作为孪生神经网络SNN中的子网络结构,并将这两个循环神经网络RNN中的一个与长短期记忆网络LSTM一起作为伪孪生神经网络PSNN的子网络结构;S5:将验证数据送入真-伪三连体神经网络中进行匹配;S6:对匹配结果进行评估,验证真-伪三连体神经网络模型的有效性;步骤S4的具体步骤如下:S4-1:计算两个特征向量的距离: 其中||·||表示欧几里得范数,disF1,F2∈[0,1;S4-2:计算两个实体e1和e2的相似度值:sime1,e2=1-disF1,F2其中sime1,e2∈0,1];S4-3:计算损失,损失函数如下: 其中,d′i和d″i分别是通过SNN和PSNN的待匹配实体的特征向量间的距离;N表示样本组的数量;所述样本组可分为两类,第一类由两个待匹配实体各自的label和第二实体的comment组成,即label2、label1和comment2;为了使模型能够从不同的同类及异类注释属性学习语义信息,第二类样本组由两个待匹配实体各自的comment和第二实体的label组成,即comment2、comment1和label2;y表示样本的种类,y=1时表示正样本,y=0时表示负样本;S4-4:根据损失函数的计算结果调整模型参数;为了最小化损失函数,RNN和LSTM通过反向传播和梯度下降,实现相关参数的优化调整;S4-5:给定训练轮次大小,当完成相应的轮次训练后就结束模型训练。

全文数据:

权利要求:

百度查询: 兰州理工大学 一种基于真-伪三连体神经网络的本体匹配方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术