买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:中国平安人寿保险股份有限公司
摘要:本发明涉及人工智能领域,公开了基于词语特征的相似度计算方法、装置、设备及存储介质,用于提高特定业务场景下文本相似度值的计算准确性。本发明方法包括:获取原始问题文本;根据原始问题文本和预置的应用场景确定目标应用场景,并获取目标应用场景对应的目标分词标准以及多个语义相似的相似问题文本;在多个语义相似的相似问题文本中选择任意一个相似问题文本作为候选问题文本,并根据目标分词标准提取原始问题文本的词语特征和候选问题文本的词语特征;得到正向文本相似度和反向文本相似度;生成相似度匹配分值;将数值最大的候选相似度值确定为目标相似度值,并选择目标相似度值对应的候选问题文本作为标准问题文本。
主权项:1.一种基于词语特征的相似度计算方法,其特征在于,包括:获取原始问题文本,所述原始问题文本用于指示查找所述原始问题文本对应的答案;根据所述原始问题文本和预置的应用场景确定目标应用场景,并获取所述目标应用场景对应的目标分词标准以及多个语义相似的相似问题文本,所述预置的应用场景包含预先设置的多个候选场景;在所述多个语义相似的相似问题文本中选择任意一个相似问题文本作为候选问题文本,并根据所述目标分词标准提取所述原始问题文本的词语特征和所述候选问题文本的词语特征;根据所述原始问题文本的词语特征和所述候选问题文本的词语特征分别进行计算,得到正向文本相似度和反向文本相似度;将所述正向文本相似度和所述反向文本相似度进行特征融合,生成相似度匹配分值,所述相似度匹配分值用于指示所述原始问题文本与所述候选问题文本之间的相似程度;将所述多个候选问题文本对应的候选相似度值进行比较,将数值最大的候选相似度值确定为目标相似度值,并选择所述目标相似度值对应的候选问题文本作为标准问题文本;所述根据所述原始问题文本的词语特征和所述候选问题文本的词语特征分别进行计算,得到正向文本相似度和反向文本相似度,包括:将原始问题文本确定为基准问题文本,将候选问题文本确定为匹配问题文本,并基于预置匹配公式计算得到正向文本相似度,预置匹配公式为,其中A表示基准问题文本,B表示匹配问题文本,表示基准问题文本A的词语token个数,表示基准问题文本A中所有层次的token归一化后的权重,表示基准问题文本对应下标的,表示匹配问题文本对应下标的,表示两个的相似度系数,;将候选问题文本确定为基准问题文本,将原始问题文本确定为匹配问题文本,并基于预置匹配公式计算得到反向文本相似度。
全文数据:
权利要求:
百度查询: 中国平安人寿保险股份有限公司 基于词语特征的相似度计算方法、装置、设备及存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。