首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于循环一致生成对抗网络的不平衡数据分类方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:西安电子科技大学

摘要:本发明公开了一种基于循环一致生成对抗网络的不平衡数据分类方法,主要解决现有技术中分类模型对噪声数据敏感、数据层方法合成样本存在类间重叠以及合成样本特征多样性匮乏的问题。其实现步骤为:1对原始数据集进行预处理;2根据预处理后数据构建孪生数据对集;3设计内部有两组判别器和生成器的循环一致生成对抗网络;4用孪生数据对集中的数据对网络模型进行迭代训练,合成目标少数类样本数据;5将目标少数类样本数据增强到原始数据集得到平衡数据集,并用该数据集训练基础分类器,完成分类。本发明能够能够在一定程度上降低分类模型对噪声数据的敏感度,有效提高分类结果准确率、改善分类性能,可用于网络异常检测。

主权项:1.一种基于循环一致生成对抗网络的不平衡数据分类方法,包括如下步骤:1对原始数据集进行预处理,得到预处理后数据集:2构建孪生数据对集合:2.1计算预处理后数据集中所有类的平均数量,将该平均数量所在十进制单位作为数量单位,判定少于该数量单位的类别为目标少数类;2.2以步骤2.1得到的数量单位作为孪生数据对的目标构建数量,从目标少数类中随机选择数据构造孪生数据对;2.3将所有所有孪生数据对以集合形式输出;3建立循环一致生成对抗网络模型:3.1构建结构相同的两个生成器,即第一生成器GXY和第二生成器GYX,然后构建这两个生成器的共同优化目标,即循环一致损失函数 其中,x表示单个训练数据,Pdatax表示数据在训练集上的概率分布,x~Pdatax表示数据x服从概率分布Pdatax,表示对服从分布Pdatax的每个训练数据x计算函数期望,y表示随机噪声数据,Pdatay表示噪声数据分布,表示对每个随机噪声数据y计算函数期望,GXYx=Fake_Y表示生成器基于数据y合成的假数据,GYXy=Fake_X表示生成器基于数据x合成的假数据;3.2构建结构相同的两个判别器,即第一判别器DX和第二判别器DY,然后构建这两个判别器的优化目标,即第一对抗损失函数和第二对抗损失函数 3.3根据循环一致损失函数第一对抗损失函数和第二对抗损失函数构建全局优化目标,即循环一致生成对抗网络模型: 其中,λ为控制循环一致损失函数的相对重要性参数;4合成目标少数类样本数据:设定最大迭代次数为E、停止迭代阈值为ε,用孪生数据对集合中的数据迭代训练步骤3中构建的网络模型,直到当前迭代的函数值小于阈值ε或达到最大迭代次数E时,输出合成的假数据GXYx=Fake_Y,即合成的目标少数类样本数据;5将合成的目标少数类样本数据补入预处理后数据集中,得到平衡训练数据集,并使用平衡数据集训练基础分类器,完成对不平衡数据的分类。

全文数据:

权利要求:

百度查询: 西安电子科技大学 基于循环一致生成对抗网络的不平衡数据分类方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术