杭州电子科技大学俞俊获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉杭州电子科技大学申请的专利基于注意力时序差分的多模态大模型幻觉检测和抑制方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121438067B 。
龙图腾网通过国家知识产权局官网在2026-04-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202512005571.5,技术领域涉及:G06F16/583;该发明授权基于注意力时序差分的多模态大模型幻觉检测和抑制方法是由俞俊;何凯昊;余宙;杨艳;潘文雯;邵镇炜;韦涛;陈伟设计研发完成,并于2025-12-29向国家知识产权局提交的专利申请。
本基于注意力时序差分的多模态大模型幻觉检测和抑制方法在说明书摘要公布了:基于注意力时序差分的多模态大模型幻觉检测和抑制方法,包括以下步骤:将提示词的文本词元和图像的视觉词元输入多模态大模型,获取多模态大模型解码阶段的内部注意力图;然后计算当前生成时刻视觉词元的注意力占比,并与前一时刻的占比做差。若差值超过设定阈值,则判定为视觉相关词元。识别到视觉相关词元时,进行一次视觉增强的第二次前向传播,以得到更准确的输出;若未识别到,则直接进入下一步生成。本发明通过注意力时序差分识别和精炼文本生成中的视觉相关词元,采用两次前向传播,基于第一次前向传播的视觉注意力图,来增强第二次前向传播的视觉注意力,能够在不降低语言表达能力的前提下,识别和修正幻觉。
本发明授权基于注意力时序差分的多模态大模型幻觉检测和抑制方法在权利要求书中公布了:1.基于注意力时序差分的多模态大模型幻觉检测和抑制方法,其特征在于,包括以下步骤: S1、将提示词的文本词元和图像的视觉词元作为前缀输入多模态大模型进行第一次前向传播,获取解码阶段的内部注意力图; 所述内部注意力图定义如下: 其中,表示查询对应的输入词元索引,表示键对应的输入词元索引,为第步生成时查询词元对键词元的注意力权重,满足归一化条件; S2、计算多模态大模型在当前生成时刻,分配给视觉词元的注意力占比; S3、将当前时刻的视觉词元注意力占比与前一时刻的视觉词元注意力占比做差,根据计算的差值来识别视觉相关词元; S4、如果识别到所述视觉相关词元,则进行视觉增强的第二次前向传播;未识别到所述视觉相关词元则继续下一个生成步骤,包括; 提取多模态大模型最后一层的所述内部注意力图中视觉词元注意力部分作为视觉增强信息; 将所述视觉增强信息乘以增强系数参数后加到多模态大模型每一层的所述内部注意力图中,生成每一层的增强内部注意力图; 将文本词元和视觉词元输入多模态大模型进行第二次前向传播,每一层用所述增强内部注意力图,替换未增强前的所述内部注意力图,生成最终输出词元; 视觉增强的前向传播中,视觉增强公式如下: 其中,表示当前生成步骤中的所述增强内部注意力图,表示所述视觉增强信息;为所述增强系数,为大于0且小于等于1的超参数;采用增强的视觉注意力图替换第一次前向传播的视觉注意力图,并与前缀视觉词元相乘,得到视觉增强后前缀的视觉词元用以生成最终输出词元;基于视觉类别置信度或注意力熵自适应调整所述增强系数。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人杭州电子科技大学,其通讯地址为:310018 浙江省杭州市钱塘区白杨街道2号大街1158号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励