Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于对比解码的大语言模型幻觉缓解方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:成都信息工程大学

摘要:本发明涉及一种基于对比解码的大语言模型幻觉缓解方法,通过从大模型最终层的预测信息中剔除潜在的幻觉成分,增强输出内容的真实性,设计多层融合机制,充分利用模型各层预测的概率分布信息。引入幻觉信息筛选模型,以简洁高效的方式,整合并分析大语言模型低层中可能蕴含的幻觉信息。通过在幻觉问答数据集上对幻觉信息筛选模型进行训练,使其能够精准捕捉并拟合数据集中普遍存在的幻觉数据特征,从而实现对幻觉信息的有效识别与过滤。在解码阶段,将模型最终层输出的概率分布与幻觉信息筛选模型输出的概率分布进行对比解码,以此差异为指导,动态调整下一个标记的生成概率分布,从而引导大语言模型在解码过程中更倾向产生真实、无幻觉的内容。

主权项:1.一种基于对比解码的大语言模型幻觉缓解方法,其特征在于,使用大语言模型最终层的预测信息减去幻觉信息达到减轻幻觉的目的,充分利用大语言模型所有层预测的概率分布,使用一个额外的幻觉信息筛选模型融合所有低层中存在的幻觉信息,通过在一些幻觉问答数据集上对幻觉信息筛选模型进行训练,使幻觉信息筛选模型拟合数据集中大部分幻觉数据的特点,并把最终层的概率分布与幻觉信息筛选模型得到的概率分布的差异作为下一个标记的分布,所述幻觉缓解方法具体包括:步骤1:加载预先训练好的幻觉信息筛选模型,如果幻觉信息筛选模型不存在,则执行以下细分的训练步骤11至步骤17,否则执行步骤2;步骤11:设计幻觉信息筛选模型,设置幻觉信息筛选模型的输入为N维,其中,N是大语言模型的层数,输出为1维;步骤12:准备幻觉问答数据集,具体为公开数据集或自行构造的问答数据集,需要包含问题和幻觉回答两个标签;步骤13:将所述幻觉问答数据集输入大语言模型,获得幻觉问答数据集中幻觉回复的标签,利用分词器,将每条数据的幻觉回复分割成token,然后将所述token映射到大语言模型的词汇表中的索引,以便用于计算损失;步骤14:获得大语言模型中除最终层外其余层对于幻觉回复预测的概率分布,把数据集中每条数据的问题作为大语言模型的输入,并根据大语言模型逐字预测的特性,得到大预言模型除最终层外的0至N-1层对于幻觉回答的每个字预测到的概率分布;步骤15:获得幻觉信息筛选模型预测的标签,把大语言模型0至N-1层对于幻觉回复预测到的概率分布堆叠起来作为幻觉信息筛选模型的输入,获取幻觉信息筛选模型计算后的概率分布,并根据贪心解码,选择概率最高的token作为幻觉信息筛选模型的预测标签;步骤16:训练幻觉信息筛选模型,将步骤15的预测标签和步骤13中幻觉答案的标签计算损失,具体采用交叉熵损失函数,并设置包括学习率、学习轮数的参数进行训练;步骤17:将损失反向传播给幻觉信息筛选模型,重复执行步骤16,当达到步骤16中的学习次数时保存幻觉信息筛选模型,再执行步骤2;步骤2:获得大语言模型的最终层对于下一个token预测的概率分布;步骤3:获得大语言模型除最终层外的0至N-1层对于下一个token预测的概率分布;步骤4:获得幻觉信息筛选模型的概率分布结果,把步骤3获得的概率分布堆叠起来作为幻觉信息筛选模型的输入,并输出幻觉信息筛选模型的概率分布;步骤5:对比解码,把大语言模型最终层预测的概率分布与幻觉信息筛选模型得到的概率分布的差值作为下一个token的概率分布;步骤6:把对比解码后的概率分布解码为文字,通过贪心解码,把概率分布解码为文字。

全文数据:

权利要求:

百度查询: 成都信息工程大学 一种基于对比解码的大语言模型幻觉缓解方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。