浙江大学李渝获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浙江大学申请的专利一种针对大语言模型的比特翻转攻击方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120952081B 。
龙图腾网通过国家知识产权局官网在2026-04-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511481729.X,技术领域涉及:G06N3/08;该发明授权一种针对大语言模型的比特翻转攻击方法及装置是由李渝;徐皓天;卓成;尹勋钊设计研发完成,并于2025-10-16向国家知识产权局提交的专利申请。
本一种针对大语言模型的比特翻转攻击方法及装置在说明书摘要公布了:本发明公开一种针对大语言模型的比特翻转攻击方法及装置,涉及大语言模型安全技术领域。方法包括:采用大语言模型生成包含问题的攻击数据集;将攻击数据集输入目标大语言模型中进行前向传播,输出文本数据;基于文本数据,构建困惑度损失函数;采用词性标注器对文本数据进行关键词元过滤处理,获得处理后的关键词元;基于处理后的关键词元,构建关键词元损失函数;将困惑度损失函数和关键词元损失函数进行整合处理,获得总损失函数;基于总损失函数计算每个参数的梯度值;基于梯度值,采用渐进式比特搜索方法搜索目标大语言模型的脆弱比特位完成翻转攻击。采用本发明可在保持目标大语言模型输出自然的前提下有效降低输出的准确性。
本发明授权一种针对大语言模型的比特翻转攻击方法及装置在权利要求书中公布了:1.一种针对大语言模型的比特翻转攻击方法,其特征在于,所述方法包括: S1、采用GPT-4o大语言模型生成包含问题的攻击数据集;将所述攻击数据集输入目标大语言模型中进行前向传播,输出与攻击数据集一一对应的文本数据; S2、基于文本数据,构建困惑度损失函数; S3、采用词性标注器对文本数据进行关键词元过滤处理,获得处理后的关键词元; S4、基于处理后的关键词元,构建关键词元损失函数; S5、将困惑度损失函数和关键词元损失函数进行整合处理,获得总损失函数; S6、基于总损失函数计算目标大语言模型中每个模块中每个参数的梯度值;基于所述梯度值,采用渐进式比特搜索方法搜索目标大语言模型的脆弱比特位,完成翻转攻击,获取评估攻击有效性的定量指标以及评估攻击的隐蔽性的定量指标; 其中,所述S6的基于所述梯度值,采用渐进式比特搜索方法搜索目标大语言模型的脆弱比特位,包括: S61、根据目标大语言模型的原始参数,采用渐进式比特搜索方法对目标大语言模型每一层的每一个模块的每个参数中最敏感的比特位进行模拟攻击,并通过总损失函数计算每个模块模拟攻击后对应的损失函数值; 其中,计算每个模块模拟攻击后对应的损失函数值的过程,通过下述公式1表示: 1 其中,表示在模块中参数的梯度;表示总损失函数;表示模块中的参数; S62、将每个模块模拟攻击后对应的损失函数值按照从小到大的顺序进行排序,选择损失函数值最小对应的模块为最脆弱模块; 其中,选择损失函数值最小对应的模块为最脆弱模块的过程,通过下述公式2表示: 2 其中,表示每个模块i进行模拟攻击后计算的损失函数值;表示最脆弱模块。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江大学,其通讯地址为:310000 浙江省杭州市西湖区余杭塘路866号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励