买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:上海岩芯数智人工智能科技有限公司
摘要:本发明提供了一种基于RAG框架的关键字多父级标题召回优化方法及装置,解决了关键字数据库的文本内容不完整,进而导致大语言模型召回准确率差的问题。将过滤处理后的知识文档通过正则表达式分别与一级标题、二级标题、三级标题、文本和文档名称进行匹配,并将匹配结果保存至ES数据库中,用于后续根据各级标题和文档名称以不同权重组装ES数据库的查询条件,通过组装后的查询条件和ES数据库,得到相似度高的上下文,结合上下文和用户的提问,由LLM输出推理结果。解决了ES数据库的文本内容不完整的问题,通过存储更丰富的关联信息提升了LLM召回结果的准确率。
主权项:1.一种基于RAG框架的关键字多父级标题召回优化的方法,其特征在于,具体包括如下步骤:步骤S1、将知识文档D1上传至ES数据库中;步骤S2、获取问题Q1并对问题Q1进行基础验证,基于问题Q1生成查询条件W1;步骤S3、通过查询条件W1在ES数据库中进行召回,形成上下文T1;步骤S4、按照相似度对上下文T1进行倒序排序,取相似度前n个上下文,形成上下文T2;步骤S5、通过上下文T2和问题Q1生成提示词P1;步骤S6、将提示词P1输入LLM,通过LLM进行推理,生成推理结果并输出;其中,n为正整数。
全文数据:
权利要求:
百度查询: 上海岩芯数智人工智能科技有限公司 一种基于RAG框架的关键字多父级标题召回优化方法及装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。