买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明涉及一种基于大语言模型的专业检索方法,包括:收集需要处理的文本数据,对所述文本数据进行预处理;利用大语言模型对预处理后的文本数据进行训练和微调,并针对训练后的所述大语言模型的检索结果预生成对应的问题;将所述预生成的对应问题作为训练数据,所述检索结果作为训练标签,训练小型模型以推理用户输入检索问题的语义和意图,以匹配预生成的问答对;当用户输入所述检索问题时,所述小型模型快速匹配所述预生成的问答对给出结果,若无法匹配获得所述预生成的问答对,则标记为待优化,本方案实现了高检索效率,并且在提升专业领域的检索准确性的同时规避了敏感的问答内容。
主权项:1.一种基于大语言模型的专业检索方法,其特征在于,包括:S1.收集需要处理的文本数据,对所述文本数据进行预处理;S2.利用大语言模型对预处理后的文本数据进行训练和微调,并针对训练后的所述大语言模型的检索结果预生成对应的问题;S3.将所述预生成的对应问题作为训练数据,所述检索结果作为训练标签,训练小型模型以推理用户输入检索问题的语义和意图,以匹配预生成的问答对;S4.当用户输入所述检索问题时,所述小型模型快速匹配所述预生成的问答对给出结果,若无法匹配获得所述预生成的问答对,将所述检索问题发送给所述大语言模型进行深度解析,生成新的问答对进行反馈,并将所述新的问答对保存用于优化小型模型。
全文数据:
权利要求:
百度查询: 中信银行股份有限公司 一种基于大语言模型的专业检索方法和系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。