买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:四川大学华西医院
摘要:本发明基于UVP‑TOF‑MS的肺癌筛查模型构建方法,包括步骤:A.呼出气样本采集;B.通过UVP‑TOF‑MS设备对采集的呼出气样本全谱分析,形成谱图样本;C.数据预处理:包括对获得的谱图样本进行各种数据常规预处理和相关计算,选择出适合的特征;D.构建模型:构建集成学习模型,基分类器对每个特征的增益重要性排序,构成集成学习模型的特征集;将逻辑斯蒂回归模型与集成学习模型共同形成一个综合的肺癌筛查预测模型;E.模型性能评估:通过混淆矩阵对肺癌筛查预测模型的性能进行预测,再筛选出表现最佳的肺癌筛查预测模型。本发明选出的特征大多数都具有显著性差异,能够作为潜在的肺癌标志物,对肺癌筛查具有积极意义。
主权项:1.基于UVP-TOF-MS的肺癌筛查模型构建方法,其特征为:包括步骤:A.呼出气样本采集:采集设定时间范围内确诊的肺癌呼出气样本、正常呼出气样本和结节呼出气样本,将正常呼出气样本与结节呼出气样本定义为非癌症呼出气样本;B.通过UVP-TOF-MS设备对采集的每个呼出气样本全谱分析,获得每个呼出气样本的谱图数据,形成谱图样本;C.数据预处理:包括对获得的谱图样本进行数据清洗、缺失值均值填充处理、异常值删除、通过标定气体将谱图样本的数据校正在同一个水平分布、环境背景扣除及峰面积计算,将谱图样本分为训练集、验证集和测试集,以及选择出适合的特征;其中,所述通过标定气体将谱图样本的数据校正时,包括计算每天的标定气体的质荷比在[77.7,78.4]范围内的峰面积,将质荷比强度低于300的值设置为0;再计算质荷比_78的标气面积:设置标准数值,该标准数值除以每天标定气体为质荷比_78的面积的商作为系数值,最后将每次呼出气样本的每个质荷比的面积乘以对应时间的系数值,得到每个呼出气样本校正以后的每个质荷比的面积数据,选择质荷比_15到质荷比_249区间范围的所有特征,删除质荷比_94以及存在数值0的比例大于90%特征;D.构建模型:构建集成学习模型,通过贝叶斯优化技术精细调整集成学习模型基分类器的超参数,得到最佳的模型参数组合;集成学习模型的基分类器根据每个特征的信息增益重要性排序,选取信息增益重要性前N个最重要的特征,构成集成学习模型的特征集,其中N为预设的自然数;将所述特征集中的特征应用到逻辑斯蒂回归模型中,所述逻辑斯蒂回归模型与集成学习模型共同形成一个综合的肺癌筛查预测模型;E.模型性能评估:通过混淆矩阵,将肺癌筛查预测模型对所述测试集进行预测,计算出肺癌筛查预测模型的准确度、灵敏度及特异度指标,以量化肺癌筛查预测模型的预测能力;再通过绘制肺癌筛查预测模型的受试者工作特征曲线,并计算曲线下面积来比较不同参数下肺癌筛查预测模型的诊断性能,基于曲线下面积的分析,筛选出表现最佳的肺癌筛查预测模型。
全文数据:
权利要求:
百度查询: 四川大学华西医院 基于UVP-TOF-MS的肺癌筛查模型构建方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。