买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:武汉大学
摘要:本发明涉及人工智能技术领域,为解决现有防御数据投毒攻击技术中存在的效率低、开销高的问题,公开了一种防御数据后门投毒的后门攻击检测与提取方法,为了成功从训练数据中提取后门触发器,将后门检测提取过程整合为多目标优化问题。为了使提取的后门触发器具有模型无关的特性,采用替代模型进行后门提取,并使用竞争性知识蒸馏方案训练替代模型,避免常规训练替代模型时存在的效果差、易过拟合的问题。最后设计序列元学习框架集成后门提取结果,提高后门的适用性。本发明可用于检测提取训练数据中可能存在的后门触发器,在面对数据投毒攻击时,数据提供方和使用方只需按照我们的方案进行对照检查,即可高效地防御数据投毒攻击。
主权项:1.一种防御数据后门投毒的后门攻击检测提取方法,其特征在于,包括以下步骤:步骤1:模型训练方选定待检测的数据集,将该数据集作为防御算法的输入,兼顾后门的攻击性与隐蔽性两个方面定义触发器,得到优化函数;步骤2:防御算法根据输入的数据集搭建替代模型组,并根据验证准确率选出最优模型作为教师模型,以竞争性知识蒸馏的方法,在每一轮训练结束时根据验证准确率更新教师模型,借助训练过程产生的梯度解决步骤1中所提出的优化函数问题;步骤3:在知识蒸馏的外层,设计与模型无关的序列元学习框架,将步骤1中触发器的参数视为模型的参数,目标是捕获能够导致后门成功的触发器,将MAML应用于触发器提取过程,通过内外两层结构集成不同替代模型的后门提取结果;步骤4:后门提取完毕后,根据提取得到的后门模式与后门位置是否符合预期,判断数据集是否遭受投毒攻击,若符合预期,则说明数据集并未遭受攻击,否则说明数据集中被恶意植入后门,此时提取的后门即为攻击者植入的后门。
全文数据:
权利要求:
百度查询: 武汉大学 一种防御数据后门投毒的后门攻击检测提取方法及设备
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。