Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于母体因素和早期孕期生物标志物的子痫前期风险预测方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:南京鼓楼医院

摘要:本发明提供一种基于母体因素和早期孕期生物标志物的子痫前期风险预测方法及系统,其中方法包括获取患者母体因素数据与早期孕期生物标志物数据;以患者母体因素与早期孕期生物标志物为输入,患者结局是否为子痫前期为输出,利用机器学习方法的投票分类器对输入数据进行训练;重复目标次数采用五折交叉验证确定机器学习模型超参数的过程,并加以自助法计算目标百分比的置信区间,以得到稳定的结果评估;对机器学习模型进行效果评估和解释,以预测子痫前期风险。本发明的模型结构简单,可对模型进行解析,得出模型内各特征贡献度,帮助进一步了解子痫前期的致病原理;同时仅使用母体因素与少量检验结果预测子痫前期,实施成本低廉,有利于广泛使用。

主权项:1.一种基于母体因素和早期孕期生物标志物的子痫前期风险预测方法,其特征在于,包括:获取患者母体因素数据与早期孕期生物标志物数据;所述母体因素数据包括孕期年龄、身高、孕期体重、生育史、子痫前期史、糖尿病史、高血压史、辅助生殖、子痫前期家族史、系统性红斑狼疮或抗磷脂综合征和结局情况;所述早期孕期生物标志物数据包括平均动脉压、子宫动脉搏动指数、血清胎盘生长因子和血浆蛋白A;以患者母体因素与早期孕期生物标志物为输入,患者结局是否为子痫前期为输出,利用机器学习方法的投票分类器对输入数据进行训练,具体包括:在随机森林分类器模型中,根据以下公式计算每个输入变量的信息增益: 其中,D为决策树上当前节点的数据集;Xi为输入变量,包括患者母体因素与早期孕期生物标志物;IGD,Xi为输入变量Xi的信息增益;EntropyD为D的熵;py为数据集D中输出变量y为子痫前期的概率;Y为输出变量集合;Dv为Xi上值为v的子集;EntropyDv为Dv的熵;ValuesXi为输入变量Xi的值的集合;选择最大信息增益的输入特征Xbest分割数据集D,得到多个子数据集;对每个子数据集进行分割,直至达到预设分割次数阈值;根据以下公式计算每个叶节点的预测类别Yleaf:Yleaf=mode{y|x,y∈Dleaf};其中,x为数据集中的样本,包含所有特征值的向量;Dleaf为叶节点集合;在极端随机树分类器模型中,对每个特征随机选择一个切分点,将最好的切分点作为节点的切分规则;根据以下公式计算切分点的信息增益: 其中,IGDp,f为选定的切分点的信息增益;I为不纯度度量;Dp为父节点的数据集;Nleft为切分后左子节点的样本数;Nright为切分后右子节点的样本数;Np为父节点的样本数;Dleft为切分后左子节点的数据集;Dright为切分后右子节点的数据集;重复目标次数采用五折交叉验证确定机器学习模型超参数的过程,并加以自助法计算目标百分比的置信区间,以得到稳定的结果评估;对机器学习模型进行效果评估和解释,以预测子痫前期风险,具体包括:利用ROC曲线与ROC曲线下与坐标轴围成的面积评估机器学习模型的性能;利用灵敏度衡量机器学习模型识别正例的能力;利用特异度衡量机器学习模型识别负例的能力;利用正确率衡量机器学习模型正确分类的样本占总样本的比例;利用假阳性率10%时的真阳性率与假阳性率20%时的真阳性率,评估在目标假阳性率水平下,机器学习模型的真阳性率;利用校正曲线、校正曲线截距与校正曲线斜率衡量机器学习模型的预测概率准确性;利用Brier分数衡量机器学习模型的概率预测的准确性;采用SHapleyAdditiveexPlanations进行模型解释,并根据以下公式计算SHAP值: 其中,Φi为第i个特征的SHAP值;S为不包含特征i的特征集合;N为所有特征的集合;|S|为集合S中的特征数量;|N|为集合N中的特征数量;fxS为考虑特征集合S时的模型预测值,fxS∪{i}为考虑特征集合S并加上特征i时的模型预测值。

全文数据:

权利要求:

百度查询: 南京鼓楼医院 基于母体因素和早期孕期生物标志物的子痫前期风险预测方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。