恭喜暨南大学苏芳萍获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜暨南大学申请的专利一种面向KNN缺失值填充模型的数据投毒检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118228131B 。
龙图腾网通过国家知识产权局官网在2024-09-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410650199.6,技术领域涉及:G06F18/2413;该发明授权一种面向KNN缺失值填充模型的数据投毒检测方法是由苏芳萍;张继连;翁健;罗伟其设计研发完成,并于2024-05-24向国家知识产权局提交的专利申请。
本一种面向KNN缺失值填充模型的数据投毒检测方法在说明书摘要公布了:本发明公开了一种面向KNN缺失值填充模型的数据投毒检测方法,属于机器学习、缺失值填充技术领域,包括:设置阈值系数并计算异常阈值,其次使用改进的局部密度异常因子算法计算计算数据集中不同缺失样本的局部密度异常因子,随后通过对比不同缺失样本的局部密度异常因子更新每个缺失样本的异常计数器,而后再检查每个缺失样本的异常计数器是否异常阈值来确定攻击者意欲攻击的目标缺失样本,最后再通过清除目标缺失样本的K个邻近进而清除数据集中的有毒样本。该检测方法可以通过灵活设定阈值系数进而选择检测强度。为防御面向KNN模型的针对性投毒攻击提供了参考依据,具备现实意义。
本发明授权一种面向KNN缺失值填充模型的数据投毒检测方法在权利要求书中公布了:1.一种面向KNN缺失值填充模型的数据投毒检测方法,其特征在于,包括以下步骤:获取待检测数据集,查找所述待检测数据集中的缺失样本;统计所述缺失样本索引数组的长度,获得缺失样本个数;基于改进的LOF算法和所述缺失样本个数对所述缺失样本进行计算,获得缺失样本预设范围的LOF值;将所述缺失样本预设范围的LOF值进行对比,将对比结果反馈至计数器中;基于参数阈值系数对所述计数器中的元素值进行判断,获得目标缺失样本检测结果;基于所述目标缺失样本检测结果判断攻击者插入的有毒样本;基于改进的LOF算法和所述缺失样本个数对所述缺失样本进行计算,获得缺失样本预设范围的LOF值的过程包括:获取所述缺失样本中数据点p到数据点o的欧式距离;将所述数据点p到数据点o的欧式距离转化为数据点p到数据点o的第K距离;基于所述数据点p到数据点o的第K距离获取第K距离邻域和第K可达距离;基于所述第K距离邻域和第K可达距离获取改进的LRD值;基于改进的LOF算法对所述改进的LRD值和所述缺失样本个数进行计算,获得所述缺失样本预设范围的LOF值;所述获取第K距离邻域的表达式为: ; ;其中,定义为所有距离点p不大于其第K距离的点,为所有距离点p不大于其第K距离的点的数量,为点p的第K距离;所述第K可达距离的表达式为: ;其中,为点p到点o的第K可达距离,为点o的第K距离,为点p与点o的距离,为点p与点的距离;基于所述第K距离邻域和第K可达距离获取改进的LRD值的表达式为: ;其中,α为平滑系数,为点p的改进局部可达密度;所述获得所述缺失样本预设范围的LOF值的表达式为: ;其中,为点p的局部异常因子;基于参数阈值系数对所述计数器中的元素值进行判断,获得目标缺失样本检测结果的过程包括:对所述计数器中的元素进行排序,生成计数器中的元素值,若所述计数器中的元素值大于所述参数阈值系数和缺失样本数量的乘积,则判断所述计数器中的元素值对应的缺失样本为目标缺失样本,并输出目标缺失样本检测结果;基于所述目标缺失样本检测结果判断攻击者插入的有毒样本的过程包括:获取目标缺失样本检测结果中每一个目标缺失样本的K个邻近;将所述每一个目标缺失样本的K个邻近判断为攻击者插入的有毒样本并删除。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人暨南大学,其通讯地址为:510632 广东省广州市天河区黄埔大道西601号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。