买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明公开了一种基于句粒度提示的大语言模型时序知识问答方法,包括以下步骤:基于本地知识库路径获取时序知识图谱文档;将获取的时序知识图谱文档进行切片操作获得N个时序知识图谱文档块;将N个时序知识图谱文档块进行句粒度改造后输入到嵌入模型获得N个时序知识图谱文档块向量;将问题输入到所述嵌入模型获得问题向量;基于问题向量和N个时序知识图谱文档块向量,选出相似度最高的K个时序知识图谱文档块向量;将K个时序知识图谱文档块向量所对应的原文和问题填充到预先构建的prompt模板,获得最终prompt模板;将最终prompt模板输入到大语言模型中,输出问题所对应的答案。本发明可以提高输出答案的准确度。
主权项:1.一种基于句粒度提示的大语言模型时序知识问答方法,其特征在于,包括以下步骤:S1:基于本地知识库路径获取该路径下所存储的时序知识图谱文档;将获取的时序知识图谱文档进行切片操作获得N个时序知识图谱文档块,其中N≥1;将所述N个时序知识图谱文档块进行句粒度改造后输入到嵌入模型获得N个时序知识图谱文档块向量;将问题输入到所述嵌入模型获得问题向量;S1进一步包括:时序知识图谱在本地知识库中以四元组-“头实体关系尾实体时间”的形式存储;所述句粒度改造的方法为:在所述尾实体和所述时间之间加入单词on,并将加入单词on后的四元组改造为字符串;将加入单词on后的四元组改造为字符串的方法包括:将四元组中的特殊字符删除;所述特殊字符包括“-”和“_”;S2:基于所述问题向量和所述N个时序知识图谱文档块向量,选出相似度最高的K个时序知识图谱文档块向量;其中1≤K≤N;S3:将所述K个时序知识图谱文档块向量所对应的原文和所述问题填充到预先构建的prompt模板,获得最终prompt模板;S3进一步包括:所述预先构建的prompt模板包括第一基础模板、第一one-shotlearning模板、第一Few-shotlearing模板、第二基础模板、第二one-shotlearning模板和第二Few-shotlearing模板;所述第一基础模板为不提供示例且限制所述大语言模型只输出一个答案的模板;所述第一one-shotlearning模板为提供一个示例且限制所述大语言模型只输出一个答案的模板;所述第一Few-shotlearing模板为提供多个示例且限制所述大语言模型只输出一个答案的模板;所述第二基础模板为不提供示例且不限制所述大语言模型输出答案数量的模板;所述第二one-shotlearning模板为提供一个示例且不限制所述大语言模型输出答案数量的模板;所述第二Few-shotlearing模板为提供多个示例且不限制所述大语言模型输出答案数量的模板;所述示例的构建方法为:基于所述问题的实体和时间,以字符串匹配的方式从知识图谱中获得所述问题的示例;所述示例用于提示大预言模型输出正确答案;将K个时序知识图谱文档块所对应的原文替换预先构建的prompt模板中的“{context}”;将所述问题替换预先构建的prompt模板中的“{question}”;S4:将所述最终prompt模板输入到大语言模型中,输出所述问题所对应的答案。
全文数据:
权利要求:
百度查询: 中国电子科技集团公司第十五研究所 中电科大数据研究院有限公司 一种基于句粒度提示的大语言模型时序知识问答方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。