首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于外部知识的大模型输出生成方法、介质及设备 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:中航信移动科技有限公司

摘要:本发明涉及大语言模型领域,特别是涉及一种基于外部知识的大模型输出生成方法、介质及设备。包括:召回多个类别的问答参考记录;按照相似度,对多个问答参考信息进行拼接,生成初始参考信息;将初始输入及初始参考信息进行拼接后,生成第一目标输入;若存在任意一个置信度大于对应类别的置信度阈值,则将第一目标输入加载至目标领域对应的专用大语言模型中,以生成对应的输出。本发明中由于置信度越高,则说明想要获取的答案也更加准确。由此根据置信度与阈值之间的关系,来确定要将第一目标输入加载至专用大语言模型还是通用大语言模型中。以进一步克服大语言模型的“幻觉”问题,提高其在精准度要求较高的垂直领域的适用性。

主权项:1.一种基于外部知识的大模型输出生成方法,其特征在于,所述方法包括如下步骤:使用初始输入分别与目标领域中的多个类别的外部知识库进行匹配,以召回多个类别的外部知识库分别对应的问答参考记录;所述问答参考记录包括:问答参考信息及置信度;所述外部知识库包括长文本知识库、短文本知识库、结构化数据知识库及意图知识库;使用目标相似度计算模型,生成初始输入分别与每一问答参考信息对应的句向量之间的相似度;所述目标相似度计算模型为基于SimCSE框架使用目标领域对应的语料训练过的RoBERTa模型;按照相似度由大到小的顺序,对多个问答参考信息进行排序拼接,生成初始参考信息;将初始输入及初始参考信息进行拼接后,生成第一目标输入;若多个问答参考信息分别对应的置信度中,存在任意一个置信度大于对应类别的置信度阈值,则将所述第一目标输入加载至所述目标领域对应的专用大语言模型中,以生成对应的输出;所述专用大语言模型为使用目标领域对应的语料对通用大语言模型进行训练得到的;在生成第一目标输入之后,所述方法还包括:若多个问答参考信息分别对应的置信度中,每一置信度均小于或等于对应类别的置信度阈值,则将所述第一目标输入加载至通用大语言模型中,以生成对应的输出;在使用初始输入分别与多个类别的外部知识库进行匹配之后,所述方法还包括:若未匹配到问答参考信息,则将所述初始输入加载至通用大语言模型中,以生成对应的输出;所述问答参考记录还包括:行程查询标记;所述行程查询标记表示对应问答参考记录中问答参考信息中答案部分的内容,与用户的行程信息中的至少一个字段对应的值相关;在召回多个类别的外部知识库分别对应的问答参考记录之后,所述方法还包括:若存在任意问答参考记录中包括行程查询标记,则获取初始输入对应用户的行程信息;使用目标相似度计算模型,生成初始输入分别与每一问答参考信息对应的句向量之间的相似度;所述目标相似度计算模型为基于SimCSE框架使用目标领域对应的语料训练过的RoBERTa模型;按照相似度由大到小的顺序,对多个问答参考信息进行排序拼接,生成初始参考信息;将所述行程信息与所述初始参考信息拼接,生成次级参考信息;将初始输入及次级参考信息进行拼接后,生成第二目标输入;将所述第二目标输入加载至所述目标领域对应的专用大语言模型中,以生成对应的输出;所述专用大语言模型为使用目标领域对应的语料对通用大语言模型进行训练得到的。

全文数据:

权利要求:

百度查询: 中航信移动科技有限公司 一种基于外部知识的大模型输出生成方法、介质及设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。