首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于多元平衡集成框架和因果网络模型的COPD筛查干预系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:山西医科大学

摘要:本发明公开了一种基于多元平衡集成框架和因果网络模型的COPD筛查干预系统,涉及疾病的筛查软件应用领域。具体步骤包括数据收集、预处理,获得该样本需要的特征变量,将特征变量信息导入多元平衡Stacking集成模型中进行预测,推断其为疾病高危个体的概率,起到提示预警作用,然后根据贝叶斯因果网络模型中的提示,确定优先干预行为,对高危个体进行干预。本发明有效提升了对COPD高危筛查的灵敏度和稳定性,且为COPD大样本人群高危筛查方法和适合特定区域的人群干预提示提供了新的研究思路及方法,为人群COPD高危筛查方法和区域化因果网络构建提供了算法模型基础,研究结果说明提供适合区域化的COPD因果网络模型能够提供疾病前期干预提示。

主权项:1.一种基于多元平衡集成框架和因果网络模型的COPD筛查干预系统,其特征在于:所述COPD筛查干预系统通过以下步骤实现:S1:采集慢阻肺疾病监测数据并对数据进行筛选处理,具体如下:S1-1:数据收集与筛选,采用多阶段分层整群随机抽样方法,筛选标准如下:S1-1-1:纳入标准:调查对象为在调查前12个月内在监测点居住至少6个月的40岁及以上的中国公民:S1-1-2:排除标准:被调查者有下列情形之一的,不予采集数据:①居住在功能区的居民,功能区包括车间、军队、学生宿舍、养老院;②患有精神障碍或认知障碍的居民,包括痴呆、理解障碍、耳聋;③新发现并正在治疗的肿瘤;④高度截瘫的居民;⑤怀孕或哺乳期妇女;S1-1-3:调查内容与方法:①问卷调查:在收集数据前,所有参与者均获得书面知情同意;调查问卷包括以下信息:人口统计学特征、对疾病的认识和知识、呼吸道症状、疾病管理、吸烟、室内污染燃料暴露、工作场所粉尘或化学品暴露的风险因素以及肺功能检查禁忌症;②人体测量:人体测量主要包括身高、体重、腰围、臀围和血压;③肺功能检查:本次监测的所有应答者均进行肺功能检查,以评估其肺功能和是否存在持续性气道阻塞;测量指标包括FEV1、FEV6、FVC;调查对象先完成基础肺功能检查,然后进行支气管扩张试验,吸入支气管扩张剂沙丁胺醇气雾剂400μg,15分钟后再次测量肺功能;对肺功能测试中有气道阻塞的受试者进行胸部前路X线检查,肺功能测试参数FEV1FVC70%;S1-1-4:根据肺功能检查结果,肺活量测定法诊断COPD,定义为支气管扩张剂后FEV1FVC0.7;BMI分为:低体重、正常体重、超重和肥胖;中心性肥胖指男性腰围≥85cm,女性腰围≥80cm;在调查时吸烟的参与者被定义为当前吸烟者;吸烟者包括现在和以前的吸烟者;家庭空气污染指的是在过去六个月或更长时间里使用木材、动物粪便或煤炭做饭或取暖;在工作中接触粉尘或有害气体被定义为职业接触;父母一方或双方患有呼吸系统疾病,呼吸系统疾病包括哮喘、慢性支气管炎、肺气肿,被定义为有呼吸系统疾病的家族史;S1-1-5:得出数据集,将无COPD确切诊断结果的参与者剔除,将剩余参与者纳入研究,根据被调查者的人口统计信息、呼吸道症状、吸烟状况、生活环境、烹饪和燃料、职业因素暴露的指标,为每个样本选择38个变量;S2:对于缺失比例小于30%的变量采用FAMD方法进行数据的填补,大于30%缺失比例的变量予以删除;数据集中的分类变量进行独热编码,连续型变量进行归一化处理;S3:利用10种包含线性和非线性的特征筛选方法对原始特征集进行联合选择,特征筛选方法包括过滤、包裹和嵌入三类方法,综合考虑10种分析方法选出最优的特征子集,建立以下特征筛选策略:S3-1:分别采用包含过滤法、包裹法和嵌入法三类特征筛选方法的10种特征选择方法对原始特征集进行特征选择;过滤法包括方差过滤、最大互信息系数MIC、Spearman相关系数,包裹法包括支持向量机递归特征消除SVM_RFE、逻辑回归递归特征消除LR_RFE,嵌入法包括支持向量机SVM、逻辑回归LR、极端随机树ET、随机森林RF、梯度提升决策树GBDT;S3-2:将10种特征筛选方法选择的10个特征子集进行汇总;S3-3:以投票的方式记录每个特征被选中的频次;S3-4:将选中频次大于等于4的变量,即同时有4种及以上方法选中的变量纳入模型作为最终的预测因子;S4:选择支持向量机SVM、逻辑回归LR、多层感知机MLP、随机森林RF模型、梯度提升决策树GBDT、极端梯度提升XGBoost、轻量的梯度提升机LightGBM7种分类算法和SMOTE、MWMOTE,Kmeans-SMOTE,Safe_Level_SMOTE,SMOTE-IPF5种平衡算法联合使用的35种组合模型中性能最优的3类组合模型作为集成学习的基分类器,将这三种组合模型的预测概率值堆叠形成新的特征集,采用LR分类算法对新的特征集进行训练得到多元平衡化的Stacking集成学习模型;S5:建立因果网络模型:选取步骤S1经过特征筛选后的数据集,并将数据集中的连续变量根据实际意义进行离散化处理,年龄40~60岁设置为中年人,61~70为年轻老人,71岁及以上为老年人;BMI值根据中国偏瘦、正常、超重和肥胖的标准进行划分;将离散化后的数据集带入Inter.iamb-Tabu混合模型当中,构建贝叶斯网络结构模型;并根据专家意见修改不合理的边,采用最大似然估计算法确定贝叶斯网络模型的参数,最终构建具有因果提示作用的贝叶斯网络因果网络模型;S6:将未知样本的COPD相关信息数据输入多元平衡Stacking集成学习模型,依次预测未知样本是否为COPD高危个体,并根据因果网络提示模型确定干预措施。

全文数据:

权利要求:

百度查询: 山西医科大学 基于多元平衡集成框架和因果网络模型的COPD筛查干预系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。