买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:凝动万生医疗科技(武汉)有限公司;凝动医疗科技(北京)有限公司
摘要:本发明属于人工智能技术领域,且公开了一种基于RAG的垂直领域知识多轮问答方法,以知识库中的文档进行重构,并构建稠密和稀疏的向量数据库,作为基础,辅助对客户原始问题进行理解与拓展,并实现问题的有效处理,利用混合查询从向量数据库中检索得到多个文档小块及元数据信息,并利用重排模型对文档小块进行排序,对相关性排序后的文档小块进行去重和合并处理。通过以上方法,使得垂直领域中的专业复杂问题得到有效的语义拆分和层级关联,提高了检索时问题相关语义的检索成功率、原文引用的精确率和召回率,同时也有效避免了历史对话混杂无用信息、文档块内容过长淹没用户真实意图等问题,能实现高效的垂直领域知识多轮问答。
主权项:1.一种基于RAG的垂直领域知识多轮问答方法,其特征在于:包括以下步骤:S1,对知识库中的文档进行重构并构建稠密和稀疏的向量数据库;S2,对用户原始问题进行理解与拓展得到处理后的问题;S3,对处理后的问题进行编码得到稠密向量和稀疏向量;S4,使用混合查询从向量数据库中检索得到多个文档小块及其元数据信息;S5,使用重排模型对检索得到的文档小块进行排序;S6,对相关性排序后的文档小块进行去重和合并处理,包括:S601,遍历排序后的文档小块,若存在文档小块的元数据信息中的大块ID与排序靠前的小块元的数据信息中的大块ID相同,则去掉所述大块ID相同的排序靠后的文档小块;S602,遍历S601处理后的文档小块,若该文档小块的元数据信息中的原始文档ID与排序更靠前的小块的元数据信息中的原始文档ID相同,则将该排序靠后的文档小块合并到文档ID相同但排序靠前的文档小块中,并去掉文档ID相同但排序靠后的文档小块;S603,遍历S602处理后的文档小块,用文档小块元数据信息中的大块文本内容作为去重和合并处理后的检索输出文档块;S7,对所述检索输出文档块进行相关性检查,得到最终检索结果;S8,若用户不是首轮对话,则对历史对话进行筛选处理;S9,将最终检索结果插入到对话记录中,将最终检索结果内容处理成一条用户记录,插入到倒数第二轮对话;S10,将对话记录作为上下文发送到大语言模型,得到回答。
全文数据:
权利要求:
百度查询: 凝动万生医疗科技(武汉)有限公司 凝动医疗科技(北京)有限公司 一种基于RAG的垂直领域知识多轮问答方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。