首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于多粒度孪生网络的中文句子语义匹配方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:湖北工业大学

摘要:本发明属于语义匹配技术领域,公开了一种基于多粒度孪生网络的中文句子语义匹配方法及系统,使用Word2Vec获得到预先训练的词向量,通过嵌入层将输入的中文句子序列将被转换为向量表示;其次,进入多粒度编码层分别从字符和单词视角捕捉句子的复杂语义特征;然后,将上一层输出的特征向量,输入语义交互层,进行语义交互;最后,将语义交互结果送入输出层,获得句子语义是否相似的结果。本发明提出来一种新的多粒度编码方式,从字符和单词两个角度捕捉句子中更丰富的语义信息,获得了更多的特征。本发明采用的孪生结构,从理论上减少了参数的数量,使模型获得了更快的训练速度。

主权项:1.一种基于多粒度孪生网络的中文句子语义匹配方法,其特征在于,所述基于多粒度孪生网络的中文句子语义匹配方法包括:使用Word2Vec获得到预先训练的词向量,通过嵌入层将输入的中文句子序列转换为向量表示;进入多粒度编码层分别从字符和单词视角捕捉句子的复杂语义特征;将上一层输出的特征向量,输入语义交互层,进行语义交互;将语义交互结果送入输出层,获得句子语义是否相似的结果;所述基于多粒度孪生网络的中文句子语义匹配方法具体包括以下步骤:步骤一,对句子进行预处理,基于预处理完的句子利用word2vec训练获得预训练的词向量;步骤二,基于预处理完的句子利用word2vec方法获得预训练好的嵌入层转换成词向量;步骤三,从字符和单词视角捕捉句子的复杂语义特征;并基于得到的复杂语义特征获得语义交互结果;判断句子语义是否匹配;步骤三中,所述从字符和单词视角捕捉句子的复杂语义特征包括:1获得转换向量,并分为字粒度的向量表示和词粒度的向量表示;2提取向量中的局部特征,并将所有特征进行融合,得到句子的复杂语义特征;所述基于得到的复杂语义特征获得语义交互结果包括:1进行句子Q1和Q2的语义特征向量的相似性比较;2将两个句子的语义特征向量进行连接;将连接后的向量输入全连接层;3将输出的向量继续输入全连接层,将原始句子Q1和Q2的语义特征向量分别输入全连接层;4将语义交互的特征向量通过步骤3后的向量,并与原始句子Q1和Q2的语义特征向量通过全连接层输出的特征向量相加。

全文数据:

权利要求:

百度查询: 湖北工业大学 基于多粒度孪生网络的中文句子语义匹配方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。