首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于LLM的文档知识问答方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:北京三维天地科技股份有限公司

摘要:本发明提供了一种基于LLM的文档知识问答方法及系统,包括以下步骤:在问答界面接收访问者的提问信息,将提问信息通过词嵌入距离与预先创建的问答知识库中的召回知识进行距离计算,确定召回的目标知识;其中,问答知识库是基于访问者自行上传的问答文档创建的,其内存储有问答文档及对应的词嵌入;将提问信息与召回的目标知识结合,生成提示信息;根据提示信息和目标知识通过LLM模型进行问答处理,得到召回内容;将召回内容反馈给访问者,以完成访问者对自己的提问信息的问答。本发明用于帮助访问者从海量知识库中快速准确地获取问题答案。

主权项:1.一种基于LLM的文档知识问答方法,其特征在于,包括以下步骤:在问答界面接收访问者的提问信息,将提问信息通过词嵌入距离与预先创建的问答知识库中的召回知识进行距离计算,确定召回的目标知识;其中,问答知识库是基于访问者自行上传的问答文档创建的,其内存储有问答文档及对应的词嵌入;将提问信息与召回的目标知识结合,生成提示信息;根据提示信息和目标知识通过LLM模型进行问答处理,得到召回内容;将召回内容反馈给访问者,以完成访问者对自己的提问信息的问答;所述创建问答知识库的步骤具体包括:获取访问者自行上传的问答文档;其中,问答文档内包含与提问信息相关联的目标知识;在接收到访问者的向量化操作请求时,利用分词模型将问答文档划分为词语,并根据指示符将分词后的文本进行段落的划分;利用词嵌入模型将每个词语转换为词向量,并对每个段落中的词向量进行求和处理,将段落以向量的形式表示,得到与问答文档对应的词嵌入结果;将问答文档与其相对应的词嵌入结果存储到向量数据库中,完成问答知识库的创建和更新;所述LLM模型进行问答处理时,可根据访问者设置的提炼参数选择对应的问答归纳方案;其中,问答归纳方案有四种,分别为第一问答归纳方案、第二问答归纳方案、第三问答归纳方案和第四问答归纳方案;第一问答归纳方案是将召回的目标知识一次性传输给LLM模型进行总结,得到答案;第二问答归纳方案是先将构成目标知识的每个知识片段分别传输给LLM模型进行总结,然后将所有知识片段总结出的结果传输给LLM模型进行再次总结,得到答案;第三问答归纳方案是先将第n段知识片段传输给LLM模型进行总结,然后将第n段知识总结出的内容和第n+1段知识片段传输给LLM模型再进行总结,重复上述步骤,直至总结完全部的知识片段,得到答案;第四问答归纳方案是将每一段知识片段进行一次总结,然后得到一个分数,最后选择一个分数最高的总结,得到答案。

全文数据:

权利要求:

百度查询: 北京三维天地科技股份有限公司 一种基于LLM的文档知识问答方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术