买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:四川大学
摘要:本发明属于疾病预测技术领域,公开了一种基于虚拟人仿真的常见重大疾病早期预测方法,包括通过结构学习和参数学习构建的基于动态贝叶斯网络的虚拟人预测模型,并通过虚拟人预测模型对常见重大疾病进行早期预测;本发明结合健康增龄纵向队列进展过程中多维动态分子变化特征,基于机器学习增强型的动态贝叶斯网络模型和群体学习等技术构建“虚拟人”仿真的预测模型,揭示复杂暴露和表型特征对多种健康结局的“多因多果”联合效应,筛选具有生物学意义的健康增龄新型标志物,通过不同层面组学信息之间的互补,提高增龄过程中重大疾病早期风险预测的灵敏度和准确性。
主权项:1.一种基于虚拟人仿真的常见重大疾病早期预测方法,其特征在于:包括通过结构学习和参数学习构建出基于动态贝叶斯网络的虚拟人预测模型,并通过虚拟人预测模型对常见重大疾病进行早期预测;其中,所述结构学习是用于从潜在因素中筛选出与风险预测相关的因素,并确定动态贝叶斯网络的拓扑结构构建虚拟人预测模型;所述结构学习是先利用模糊理论将知识转换为归一化模糊隶属度,通过隶属度确定两个变量之间的因果关系,并将两个变量之间的关系作为搜索贝叶斯网络结构空间的强限制条件或者弱限制条件构建出多个初始虚拟人预测模型;然后利用分区MCMC方法从多个初始虚拟人预测模型中探索出最优的虚拟人预测模型;所述知识包括不限于病例数据、医学文献、专家意见;通过隶属度确定两个变量之间的因果关系:当隶属度为0,两个变量之间不存在因果关系,当隶属度为1,两个变量之间存在因果关系,当隶属度在0与1之间,两个变量之间的因果关系不能确定;所述强限制条件是指隶属度为0和隶属度为1时两个变量的因果关系,所述弱限制条件是指隶属度在0与1之间两个变量的因果关系;所述分区MCMC方法包括:根据分区要求和分区规则将贝叶斯网络的初始拓扑结构中所有变量分成m个区并对其依次编号,设第i区i=1,2,…,m的变量个数为ki,变量个数,各个分区中的变量个数,每个分区中的具体变量为πλ,标记分区Λ=λ,πλ,标记分区Λ下的贝叶斯网络结构为;在给定数据D的情况下,标记分区Λ的后验分布正比于对贝叶斯网络结构中每个节点Xi及其父节点Pai的评分进行合并后得到的总评分,总评分为标记分区空间与贝叶斯网络结构空间的等价性,根据总评分最大的标记分区确定贝叶斯网络结构空间中最优的网络结构;每次迭代中,当前标记分区为Λ,提议标记分区为Λ*,接受概率为,其中,为标记分区的邻域,该邻域由标记分区将一个分区拆分成两个分区或者将两个相邻分区合并成为一个分区;所述分区要求包括同一个区内的变量之间没有箭头连接、第1区的变量没有父节点、除第1区外其他每个区的各个变量必须至少有一个来自前一个区的父节点;所述分区规则由强限制条件决定,对于强限制条件中没有明确规定的变量采用随机模拟的方式分区;所述参数学习用于确定最优的虚拟人预测模型中每个变量在给定其父节点集的条件下的概率分布利用已有的数据集估计出最优的虚拟人预测模型中各个节点之间的条件概率关系,为每个节点分配概率参数;所述参数学习以常见重大疾病分期作为风险评估的分类结局指标并先通过EKM方法聚类后再利用扩增型两阶段stacking算法进行预测结果;最后通过网格搜索法和5折交叉验证来确定虚拟人预测模型的最优参数,从而构建出最终的虚拟人预测模型;所述扩增型两阶段stacking算法是将N个不同的初级学习器对同一数据集的输出类后验概率分别作为元层分类器的N个固定维度的输入向量,且在stacking算法的基础上增加一个初级层;根据数据集的类型不同选择不同的初级学习器,针对图像型数据的初级学习器包括卷积神经网络CNN、全卷积网络FCN和深度玻尔兹曼机DBM;针对文本型数据的初级学习器包括循环神经网络RNN、长短期记忆网络LSTM和门控循环单元GRU;针对数值型数据的初级学习器包括logistic回归、支持向量机SVM和朴素贝叶斯。
全文数据:
权利要求:
百度查询: 四川大学 基于虚拟人仿真的常见重大疾病早期预测方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。