首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种文本相似度计算方法、装置、设备及存储介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:华润数字科技(西安)有限公司

摘要:本发明实施例属于人工智能领域,尤其涉及一种文本相似度计算方法、装置、设备及存储介质,所述方法包括:识别待比对文本中的数学符号,根据预设的符号‑文字字典查找数学符号对应的文字描述,并将待比对文本中的数学符号替换成查找到的文字描述;对待比对文本进行分词,基于分词计算待比对文本中每个句子的初级表征向量,其中待比对文本至少为两个;将不同的待比对文本中每个句子的初级表征向量输入到语义编码器,通过语义编码器计算得到待比对文本的最终表征向量,语义编码器至少为两个;及语义编码器将待比对文本的最终表征向量输入到相似度计算器,获取不同两个待比对文本的相似度。本发明提高了相似性度计算的稳定性和准确性。

主权项:1.一种文本相似度计算方法,其特征在于,包括下述步骤:识别待比对文本中的数学符号,根据预设的符号-文字字典查找所述数学符号对应的文字描述,并将所述待比对文本中的数学符号替换成查找到的文字描述;对待比对文本进行分词,基于所述分词计算所述待比对文本中每个句子的初级表征向量,其中所述待比对文本至少为两个,所述基于所述分词计算所述待比对文本中每个句子的初级表征向量的步骤,具体包括:根据词向量模型,获得所述分词的词嵌入向量;根据题库模型,获得所述分词的语义角色向量;根据所述分词在句子中的索引位置,获得所述分词的位置向量;将所述待比对文本中每个句子分词后的词嵌入向量、语义角色向量和位置向量中每个维度的元素相加,得到每个句子的初级表征向量;将不同的所述待比对文本中每个句子的初级表征向量输入到语义编码器,通过所述语义编码器计算得到所述待比对文本的最终表征向量,所述语义编码器至少为两个;以及所述语义编码器将所述待比对文本的最终表征向量输入到相似度计算器,获取不同两个待比对文本的相似度。

全文数据:

权利要求:

百度查询: 华润数字科技(西安)有限公司 一种文本相似度计算方法、装置、设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。