买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本申请涉及信息检索技术领域,提供了一种基于大模型的检索增强方法、装置、智能客服系统及介质。该方法在获取当前用户输入的用户问题内容和相应的用户意图后,采用预先训练好的召回模型,对输入的用户问题内容与标准问答库中的标准问题进行匹配,得到与用户问题内容匹配的预设数量个标准问答信息;标准问答信息包括匹配的标准问题和相应的标准回复;基于用户意图,采用预先训练好的大模型,对预设数量个标准问答信息进行分析,得到各标准问答信息的输出概率;基于各标准问答信息的输出概率,获取用户问题内容的回复结果。该方法通过搭建算法模型,提升了智能客服回复用户提问的准确率。
主权项:1.一种基于大模型的检索增强方法,其特征在于,应用于智能客服系统中,所述方法包括:获取当前用户输入的用户问题内容和相应的用户意图;采用预先训练好的召回模型,对输入的用户问题内容与标准问答库中的标准问题进行匹配,得到与所述用户问题内容匹配的预设数量个标准问答信息;所述召回模型是基于客服系统存储的历史用户问题内容和标准问答库中的标准问题组成的正样本对和负样本对,对目标神经网络模型进行迭代训练得到的;所述标准问答信息包括匹配的标准问题和相应的标准回复;基于所述用户意图,采用预先训练好的大模型,对预设数量个标准问答信息进行分析,得到各标准问答信息的输出概率;基于所述各标准问答信息的输出概率,获取所述用户问题内容的回复结果;其中,所述正样本对包括与历史用户问题内容具有相同历史用户意图的任一历史用户问题内容和第一标准问题组成的样本对,以及具有相同历史用户意图的两个不同历史用户问题内容组成的样本对;所述负样本对包括与历史用户问题内容具有不同历史用户意图的任一历史用户问题内容和第二标准问题组成的样本对,以及具有不同历史用户意图的两个不同历史用户问题内容组成的样本对;其中,所述召回模型的训练过程包括:获取智能客服系统存储的历史用户问题内容和相应的历史用户意图;基于历史用户意图和标准问答库,构建包含所述正样本对和所述负样本对的训练样本对;采用In-Batch对比学习的方式,将所述训练样本对输入目标神经网络模型,并采用预设损失函数对目标神经网络模型输出的结果进行收敛处理,直至满足预设收敛条件,以得到训练好的召回模型;其中,所述预设损失函数为带掩码的对比学习损失函数,表示为: 其中,N为训练样本中标准问题的数量和用户问题的数量;为第i个标准问题,为第i个用户问题,为第j个标准问题,为第j个用户问题,f.为匹配函数,τ为温度系数,m.为掩码函数,当时,取值为0,否则取值为1e9,其中,ID.表示编号函数,当为标准提问时,取值为标准提问的编号,该编号为相应标准提问在标准问答库中的编号,当为相似提问时,取值为相似问题对应的标准提问的编号。
全文数据:
权利要求:
百度查询: 智者四海(北京)技术有限公司 基于大模型的检索增强方法、装置、智能客服系统及介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。