首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种数据中毒攻击的检测和防御方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:中国电子科技集团公司第三十研究所

摘要:本发明公开了一种数据中毒攻击的检测和防御方法,其包括:对含毒化数据的训练数据集进行清洗,得到干净训练集;修复后门数据,构建触发器的拦截器来抵消后门触发的影响。本发明能够有效检测被毒化数据并对数据中毒攻击进行准确抵御,修复模型后门。

主权项:1.一种数据中毒攻击的检测和防御方法,其特征在于,包括:步骤1:对含毒化数据的训练数据集采用模型嵌套训练方法进行清洗,得到干净训练集;步骤2:修复后门数据,构建触发器的拦截器来抵消后门触发的影响;具体为:首先选择m个训练模型,并计算m个训练模型的标准差;按照递增顺序将含毒化数据的训练数据集中的训练数据点进行排序,为中的第i个训练样本,是的标签;若训练中的干净数据小于或等于的样本容量,则持续计算含毒化数据的训练数据集;并且基于在人工智能算法训练得到分类模型,并计算在使用数据样本基础下得到的分类模型的错误率;若,则停止迭代,更新使得,并增加模型训练误差,其中,为在使用干净数据基础下得到的分类模型的错误率,为误差限度;直到干净数据大于的样本容量,输出干净训练集;所述步骤2包括:遍历每个数据流中的数据data,使用触发器扫描定位方法判断是否存在后门触发器,若判断存在,则采用k均值聚类算法基于数据data的主要特征进行聚类,确认该后门触发器是否造成预测结果的改变,若发生改变,则采用后门再确认法确认是否为真正的后门触发器,最后基于k均值聚类算法的结果,对该后门进行修复,并保存修复后的数据流;遍历完成后,最终得到预测集和后门集合;通过所述触发器扫描定位方法,包括:对数据data中的所有样本的主要特征采用k均值聚类算法,通过触发阻止程序阻止后门触发并产生纯净训练数据,若纯净训练数据对应的数据data经过后门触发器检测得到不同结果,则记录后门位置,并对该数据使用后门再确认方法,进一步确认是否为后门,最后得到后门触发器的定位;再结合步骤1得到的干净训练集,取共同元素集合,得到最终的纯净训练数据;所述后门再确认方法包括:从训练数据中选择k个随机的分类正确的数据;采用触发器修复程序提取数据特征;遍历中所有需要确认数据的特征Fea,将数据经过后门触发器作用后得到新的特征,若原特征Fea和对应新的特征经过后门确认,得到不同的结果,则计数器加1;基于计数器和数据以及训练阈值,得到是否为真正的后门。

全文数据:

权利要求:

百度查询: 中国电子科技集团公司第三十研究所 一种数据中毒攻击的检测和防御方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。