首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于动态信息价值准则和集成学习的动脉粥样硬化风险预测方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:南京信息工程大学

摘要:本发明为基于动态信息价值准则和集成学习的动脉粥样硬化风险预测方法,公开了所述方法包括:基于动态信息价值准则对采集的数据集进行筛选,分为最优特征集和残留特征集;基于机器学习算法将最优特征集与残留特征集作为基分类器A、基分类器B;根据基分类器A、基分类器B建立预测模型A和预测模型B;将最优特征集和残留特征集输入预测模型A和预测模型B,将所得到的预测结果加权集成,输出最终集成学习预测结果,本发明在使用机器学习算法进行动脉粥样硬化风险预测的基础上,由模型预测效果优劣来进行特征筛选,挑选出数据冗余度低、有代表性的特征,考虑到了更为优秀的特征、提高了模型预测效果。

主权项:1.基于动态信息价值准则和集成学习的动脉粥样硬化风险预测方法,其特征在于,所述方法包括:基于动态信息价值准则对采集的数据集进行筛选,分为最优特征集和残留特征集;基于机器学习算法将最优特征集与残留特征集作为基分类器A、基分类器B;根据基分类器A、基分类器B建立预测模型A和预测模型B;将最优特征集和残留特征集输入预测模型A和预测模型B,将所得到的预测结果加权集成,输出最终集成学习预测结果;所述数据集采集的方法包括:选择有关引发动脉粥样硬化的因素作为原始特征集,并采集有动脉粥样硬化症状及健康人员样本作为动脉粥样硬化风险组与对照组,构成训练样本集并保留测试集;所述动态信息价值准则包括步骤:基于机器学习算法,将样本集输入预先构建的动脉粥样硬化预测模型,计算出KS统计量;通过KS统计量来衡量模型的整体预测效果;基于原始特征集计算各特征对于目标变量是否有动脉粥样硬化风险的信息价值指标IV;选择最大的IV值特征作为中心特征,将其从原始特征集中纳入中心特征集中;响应于原始特征集中特征数量不大于0,建立预测模型;计算剩余特征对中心特征的IV值,将对中心特征IV值最高的特征移出原始特征集,纳入残留特征集中;将中心特征集与筛去残留特征的原始特征集合并为联合特征集,基于机器学习算法,建立联合特征集与目标变量的动脉粥样硬化预测模型;比较各联合特征集所构建的动脉粥样硬化预测模型KS统计量结果,选择最优KS值组,将其作为最优特征集;输出最优特征集,完成基于动态信息价值准则的特征筛选。

全文数据:

权利要求:

百度查询: 南京信息工程大学 基于动态信息价值准则和集成学习的动脉粥样硬化风险预测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。