买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:哈尔滨理工大学
摘要:本发明涉及一种基于间接概率密度的SMOTE采样方法。使用基于SVM支持向量机的UnderBagging‑alike欠采样集成估计方法对原始数据集进行间接分布信息探索。并根据分布信息将识别错误概率超过0.5的样本视为噪声样本进行筛除处理,并将去噪后的少数类样本根据分布信息进行权重分配,进一步决定每个少数类样本所需生成新样本数量,并使用SMOTE算法进行样本平衡。
主权项:1.一种基于间接概率密度的SMOTE采样方法,其特征在于,该方法包括以下步骤:步骤1:使用UnderBagging-alike欠采样集成估计方法对原始数据集进行间接分布信息探索;步骤2:基于混淆信息对数据集进行噪声过滤,避免噪声样本在过采样过程中产生噪声传播现象,最终影响分类器学习效果;步骤3:根据样本间接分布信息,为去噪后的少数类样本依次分配权重,作为被选择成为种子样本的概率保证;步骤4:根据样本的权重情况,选取种子样本进行过采样,直到达到类别平衡。
全文数据:
权利要求:
百度查询: 哈尔滨理工大学 一种基于间接概率密度的SMOTE采样方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。