首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于欠采样改进的AdaBoost算法的脱贫时间预测方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:中南民族大学

摘要:本发明公开了一种基于欠采样改进的AdaBoost算法的脱贫时间预测方法,该方法包括以下步骤:通过入库贫困户相关基本信息进行整理,提取致贫敏感信息,作为模型的输入;通过抽取贫困户的入库日期以及脱贫日期,得到贫困户从入库到脱贫所用的时间即脱贫年限,作为模型的输出;在建模过程中采用自适应聚类的近邻欠采样技术对AdaBoost算法进行改进,得到ACNUSBoost算法,通过自适应聚类算法对训练样本中的多数类样本进行聚类,针对每个簇的聚类中心保留一定比例的近邻样本作为代表性样本,随机去除部分剩余的多数类样本;并对分类器进行多次线性组合,得到基于ACNUSBoost算法的脱贫时间预测模型;本发明利用欠采样技术解决AdaBoost算法中少数类样本有限的问题,能准确进行脱贫时间的预测。

主权项:1.一种基于欠采样改进的AdaBoost算法的脱贫时间预测方法,其特征在于,该方法包括以下步骤:训练阶段:获取贫困户数据库,通过入库贫困户相关基本信息进行整理,提取致贫敏感信息,作为模型的输入,即训练样本;通过抽取贫困户的入库日期以及脱贫日期,得到贫困户从入库到脱贫所用的时间即脱贫年限,作为模型的输出;在建模过程中采用自适应聚类的近邻欠采样技术对AdaBoost算法进行改进,得到了ACNUSBoost算法,通过自适应聚类算法对训练样本中的多数类样本进行聚类,针对每个簇的聚类中心保留一定比例的近邻样本作为代表性样本,随机去除部分剩余的多数类样本,少数类样本数量保持不变;并对分类器进行多次线性组合,得到基于ACNUSBoost算法的脱贫时间预测模型;测试阶段:输入待预测的贫困户数据,通过基于ACNUSBoost算法的脱贫时间预测模型,输出预测的脱贫时间;该方法中采用K均值聚类作为近邻欠采样技术中的聚类算法,在确定K值的过程中,首先进行初始聚类,然后比较此时各个聚类簇中的覆盖准确率与错误率的差值,选择差值较大的K,其中K的范围是n为样本数;使用K-means++算法确定初始聚类中心,通过欧式距离度量样本之间的相似性;该方法中改进后的ACNUSBoost算法具体包括以下步骤:步骤1、初始化训练样本的初始权重,各个训练样本的初始权重均相同,初始权重为步骤2、通过自适应聚类的近邻欠采样技术,即ACNUS技术,处理训练样本,对处理后的训练样本集进行训练,得到多个基分类器,并更新每个训练样本的权重;步骤3、根据更新后的权重,对基分类器进行线性组合,得到基于ACNUSBoost算法的脱贫时间预测模型;步骤2的具体方法为:步骤2.1、对训练样本集中t=1,2,3,…,T,使用ACNUS技术处理多数类样本,产生训练样本子集Dt,其中Dt={x1,x2,…xN};步骤2.2、对训练样本子集Dt进行训练,得到基分类器Gtx=fDt;步骤2.3、计算Gtx在训练样本子集Dt上的分类错误率et;et=PGtxi≠yi如果et0.5,则迭代停止;步骤2.4、计算基分类器Gtx的权重αt; 步骤2.5、对于训练样本子集Dt中的每一个样本更新其权重; 步骤2.6、t+1,判断t是否大于T,若是执行下一步,否则执行步骤2.1;步骤2.1中ACNUS算法的具体方法为:步骤2.1.1、确定聚类簇K的个数;在范围内通过二分策略对K进行取值,每次取值后对样本进行划分并随机生成类中心,并计算上述划分类覆盖样本正确率与错误率的差值,选择差值最大时K的取值;步骤2.1.2、使用K均值聚类算法对多数类样本进行聚类,得到K个聚类中心U={u1,u2,…uk},则每个聚类簇样本数目是步骤2.1.3、设置采样子集i=1;步骤2.1.4、保留第i个聚类中心μi的近邻样本,样本数为Pi;步骤2.2.5、在剩余的个样本中随机去除Oi个样本,并将其移入到子集Q中;步骤2.1.6、i+1,判断i是否大于K,若是则执行步骤2.1.7,否则返回执行步骤2.1.4;步骤2.1.7、得到欠采样后的样本集D'=D-Q,此时Dt=D';步骤3中进行线性组合的方法为: 其中,fx为组合后的分类器,基分类器Gtx的对应权重为αt。

全文数据:

权利要求:

百度查询: 中南民族大学 一种基于欠采样改进的AdaBoost算法的脱贫时间预测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。