一种基于对比解码的大语言模型幻觉缓解方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：成都信息工程大学

摘要：本发明涉及一种基于对比解码的大语言模型幻觉缓解方法，通过从大模型最终层的预测信息中剔除潜在的幻觉成分，增强输出内容的真实性，设计多层融合机制，充分利用模型各层预测的概率分布信息。引入幻觉信息筛选模型，以简洁高效的方式，整合并分析大语言模型低层中可能蕴含的幻觉信息。通过在幻觉问答数据集上对幻觉信息筛选模型进行训练，使其能够精准捕捉并拟合数据集中普遍存在的幻觉数据特征，从而实现对幻觉信息的有效识别与过滤。在解码阶段，将模型最终层输出的概率分布与幻觉信息筛选模型输出的概率分布进行对比解码，以此差异为指导，动态调整下一个标记的生成概率分布，从而引导大语言模型在解码过程中更倾向产生真实、无幻觉的内容。

主权项：1.一种基于对比解码的大语言模型幻觉缓解方法，其特征在于，使用大语言模型最终层的预测信息减去幻觉信息达到减轻幻觉的目的，充分利用大语言模型所有层预测的概率分布，使用一个额外的幻觉信息筛选模型融合所有低层中存在的幻觉信息，通过在一些幻觉问答数据集上对幻觉信息筛选模型进行训练，使幻觉信息筛选模型拟合数据集中大部分幻觉数据的特点，并把最终层的概率分布与幻觉信息筛选模型得到的概率分布的差异作为下一个标记的分布，所述幻觉缓解方法具体包括：步骤1：加载预先训练好的幻觉信息筛选模型，如果幻觉信息筛选模型不存在，则执行以下细分的训练步骤11至步骤17，否则执行步骤2；步骤11：设计幻觉信息筛选模型，设置幻觉信息筛选模型的输入为N维，其中，N是大语言模型的层数，输出为1维；步骤12：准备幻觉问答数据集，具体为公开数据集或自行构造的问答数据集，需要包含问题和幻觉回答两个标签；步骤13：将所述幻觉问答数据集输入大语言模型，获得幻觉问答数据集中幻觉回复的标签，利用分词器，将每条数据的幻觉回复分割成token，然后将所述token映射到大语言模型的词汇表中的索引，以便用于计算损失；步骤14：获得大语言模型中除最终层外其余层对于幻觉回复预测的概率分布，把数据集中每条数据的问题作为大语言模型的输入，并根据大语言模型逐字预测的特性，得到大预言模型除最终层外的0至N-1层对于幻觉回答的每个字预测到的概率分布；步骤15：获得幻觉信息筛选模型预测的标签，把大语言模型0至N-1层对于幻觉回复预测到的概率分布堆叠起来作为幻觉信息筛选模型的输入，获取幻觉信息筛选模型计算后的概率分布，并根据贪心解码，选择概率最高的token作为幻觉信息筛选模型的预测标签；步骤16：训练幻觉信息筛选模型，将步骤15的预测标签和步骤13中幻觉答案的标签计算损失，具体采用交叉熵损失函数，并设置包括学习率、学习轮数的参数进行训练；步骤17：将损失反向传播给幻觉信息筛选模型，重复执行步骤16，当达到步骤16中的学习次数时保存幻觉信息筛选模型，再执行步骤2；步骤2：获得大语言模型的最终层对于下一个token预测的概率分布；步骤3：获得大语言模型除最终层外的0至N-1层对于下一个token预测的概率分布；步骤4：获得幻觉信息筛选模型的概率分布结果，把步骤3获得的概率分布堆叠起来作为幻觉信息筛选模型的输入，并输出幻觉信息筛选模型的概率分布；步骤5：对比解码，把大语言模型最终层预测的概率分布与幻觉信息筛选模型得到的概率分布的差值作为下一个token的概率分布；步骤6：把对比解码后的概率分布解码为文字，通过贪心解码，把概率分布解码为文字。

全文数据：

权利要求：

百度查询：成都信息工程大学一种基于对比解码的大语言模型幻觉缓解方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：监控视频的轮巡控制方法、装置、设备及存储介质

下一篇：一种基于蜣螂优化算法的智能车轨迹跟踪控制方法

相关技术

监控视频的轮巡控制方法、装置、设备及存储介质

一种基于蜣螂优化算法的智能车轨迹跟踪控制方法

一种汽车减震器的衬套装配装置

一种一体式行星齿轮组减速机构

一种铅酸电池自动组装设备及工艺

一种通用性电机调速模块

双酚A型聚碳酸酯降解用催化剂及降解方法

一种无施工平台的远岸成品钢管桩的测量方法

设备健康预测方法和计算机可读存储介质

用于确定泡沫生产的参数的系统和方法

一种身份认证方法、系统、电子设备及存储介质

一种变压器电磁温度流体多物理场间接耦合计算方法及系统

语言相关技术

基于语言模型的电力知识问答系统_中科合肥技术创新工程院_202411428396.X

一种英语语言学习辅助系统_蚌埠学院_202411393232.8

一种基于民航大语言模型的智能系统_中航信移动科技有限公司_202411436897.2

用于无监督语言模型权重选择的最佳路径变化率_腾讯美国有限责任公司_202080015407.5

大语言模型安全对齐训练方法、装置、电子设备及介质_清华大学_202410859925.5

基于流水线并行的大语言模型数据高效预处理方法及系统_中国电子科技集团公司第十五研究所_202410933105.6

一种大语言模型安全优化方法、装置、设备及介质_香港科技大学(广州)_202411029274.3

基于大语言模型的复杂数据库问答系统_北京中科思创云智能科技有限公司_202411441708.0

一种文本转数据库查询语言的方法、系统、设备及介质_上海繁易信息科技股份有限公司_202410975380.4

一种基于大语言模型的文本提取方法及系统_浙江中控信息产业股份有限公司_202411107236.5

模型相关技术

数字道路模型构建方法_太原林捷电子科技有限公司_202411058970.7

模型风力机装置_中国长江三峡集团有限公司_202420897609.2

用于数字孪生车间模型的设备模型位置调整方法及系统_优铸科技(北京)有限公司_202410216272.9

一种大语言模型驱动GPT小模型的智能文本多标签方法_中电万维信息技术有限责任公司_202410774674.0

模态分类模型的训练、应用方法及模型、设备、介质_北京大学深圳医院(北京大学深圳临床医学院)_202411217864.9

一种焊片偏移量检测模型构建方法及模型_沈阳塞克西机电设备有限公司_202411033085.3

一种气道信息检测的模型、模型训练方法及其应用方法_中国人民解放军海军军医大学_202410806053.6

一种基于AI大模型的问答模型训练方法_中国建筑国际集团有限公司_202410974957.X

基于大模型的3D虚拟模型控制方法、装置、设备及介质_北京格如灵科技有限公司_202410925121.0

道路的长期共享世界模型_北美日产公司_202380030850.3

幻觉相关技术

一种基于对比解码的大语言模型幻觉缓解方法_成都信息工程大学_202410955938.2

一种基于多模态的对比解码幻觉减轻方法、装置及终端_哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)_202411463649.7

一种大语言模型幻觉检测方法及装置_中国人民解放军军事科学院军事科学信息研究中心_202411003683.6

一种基于大模型自我校验用于RAG系统缓解大语言模型幻觉的方法_北京白龙马云行科技有限公司_202410958130.X

语言幻觉检测模型的生成方法、装置及电子设备_网易(杭州)网络有限公司_202410780312.2

一种基于视觉证据的视频描述物体幻觉修正方法_重庆邮电大学_202410920987.2

一种减轻大模型幻觉的系统性方法_暗物智能科技(广州)有限公司_202410954824.6

模型幻觉的检测方法、装置、设备、存储介质和程序产品_腾讯科技(深圳)有限公司_202411047436.6

基于自洽投票的大语言模型幻觉检测器自我迭代训练方法_上海人工智能创新中心_202410842355.9

一种可旋转的视幻觉悬浮台灯_深圳市三和晟电子有限公司_202420608973.2

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于对比解码的大语言模型幻觉缓解方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务