买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本申请提供了一种语句匹配方法、语句匹配装置、智能设备及计算机可读存储介质,其中,该方法包括:接收输入语句;对所述输入语句进行预处理;将与处理后的所述输入语句输入至已训练的第一检索模型及第二检索模型中,得到候选语句集合,所述候选语句集合中包含有一条以上与所述输入语句相匹配的候选语句;将所述输入语句以及所述候选语句集合输入至已训练的排序模型中,得到各个候选语句与所述输入语句的相似度得分;获取所述排序模型所输出的排序后的各个候选语句。通过本申请方案,可实现检索精度与检索时间的平衡。
主权项:1.一种语句匹配方法,其特征在于,包括:接收输入语句;对所述输入语句进行预处理,并将预处理的结果存储在相应的缓存空间等待调用;将处理后的所述输入语句并行输入至已训练的第一检索模型及第二检索模型中,并基于所述第一检索模型及所述第二检索模型的输出结果作并集得到候选语句集合,其中,所述第一检索模型用于基于所述输入语句的字词在预设的语料库中检索与所述输入语句相匹配的语句,所述第二检索模型用于基于所述输入语句的语义在所述语料库中检索与所述输入语句相匹配的语句,所述候选语句集合中包含有一条以上与所述输入语句相匹配的候选语句;将所述输入语句以及所述候选语句集合输入至已训练的排序模型中,得到各个候选语句与所述输入语句的相似度得分,其中,所述排序模型基于随机森林模型及线性模型构建而得,所述排序模型通过所述随机森林模型训练所确定的一个以上文本特征实现对各个候选语句与所述输入语句的相似度得分的计算;获取所述排序模型所输出的排序后的各个候选语句,其中,所述各个候选语句基于所述相似度得分由高至低的顺序进行排序;其中,所述语句匹配方法还包括:基于预设的标准验证集,通过所述随机森林模型对候选文本特征进行训练,其中,所述候选文本特征包括:ElasticSearch相似度得分、BERT语义相似度得分、杰卡德相似度得分、编辑距离得分、关键词语匹配相似度得分、业务词语匹配相似度得分、名词匹配相似度得分及动词匹配相似度得分,其中,所述ElasticSearch相似度得分通过所述第一检索模型而得,所述BERT语义相似度得分通过所述第二检索模型而得;根据所述随机森林模型对所述候选文本特征的训练结果,确定所述排序模型所采用的文本特征;通过所述线性模型对所述排序模型所采用的文本特征进行训练,以确定所述排序模型所采用的各个文本特征的权重;基于所述排序模型所采用的文本特征,以及所述排序模型所采用的各个文本特征的权重,获得已训练的匹配模型。
全文数据:
权利要求:
百度查询: 深圳市优必选科技股份有限公司 一种语句匹配方法、语句匹配装置及智能设备
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。