Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

疾病筛查模型的构建方法、疾病筛查模型及筛查装置专利

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:北京橡鑫生物科技有限公司;天津橡鑫生物科技有限公司;北京橡鑫医学科技有限公司

申请日:2021-03-01

公开(公告)日:2022-02-18

公开(公告)号:CN112599251B

专利技术分类:.用于医疗数据的挖掘,例如分析其他患者以前的病例[2018.01]

专利摘要:本发明提供了一种疾病筛查模型的构建方法、疾病筛查模型及筛查装置。该模型的构建方法包括:从两组测序数据中筛选出满足预测条件的多个待检特征,两组测序数据包括阳性样本组中各阳性样本的测序数据和阴性样本组中各阴性样本的测序数据;利用多个待检特征进行机器学习,从而构建得到疾病筛查模型。通过获取多个阳性样本和多个阴性样本的测序数据,并根据两组测序数据的特征差异,从中选择出与疾病关联性较强的多个特征作为表征两组不同疾病状态的待检特征进行机器学习建模,从而获得不同疾病的筛查模型,该模型提高了筛查的准确性。

专利权项:1.一种疾病筛查模型的构建方法,其特征在于,所述构建方法包括:从两组测序数据中筛选出满足预测条件的多个待检特征,所述两组测序数据包括阳性样本组中各阳性样本的测序数据和阴性样本组中各阴性样本的测序数据,所述测序数据的测序深度为0.1×~1×;利用多个所述待检特征进行机器学习,从而构建得到所述疾病筛查模型;从两组测序数据中筛选出满足预测条件的多个待检特征包括:统计所述两组测序数据中各样本的候选特征;对各所述候选特征分别绘制ROC曲线;筛选出AUC≥预设值的所述候选特征,作为所述待检特征;其中,各样本的所述候选特征选自如下特征:1)文库浓度;2)CNV,所述CNV包括CNV个数及CNV总长度;3)异常比对reads,所述异常比对reads包括:soft-clipreads占总reads数的比例,记为第一比例;插入片段大于100000bp的reads占总reads数的比例,记为第二比例;以及所述第一比例与所述第二比例之和;4)插入片段大小,所述插入片段大小包括:不同插入片段长度范围的reads数占总reads的比例;以及不同插入片段长度范围的reads数占总reads数的比例的熵;5)末端碱基,所述末端碱基包括:支持reads末端1-5个bp长度的各碱基组合类型reads数占总reads数的比例;以及reads末端1-5个bp长度的各碱基组合类型reads数占总reads数的比例的熵;所述待检特征选自如下全部:a.文库浓度;b.插入片段大于100000bp的reads占总reads数的比例;c.CNV个数;d.CNV总长度;e.不同插入片段长度范围的reads数占总reads数的比例的熵;f.支持reads末端1bp的reads数各占总reads数的比例;g.支持reads末端1bp的reads数各占总reads数的比例的熵;h.支持reads末端2bp的reads数各占总reads数的比例;i.支持reads末端2bp的reads数各占总reads数的比例的熵;所述不同插入片段长度范围包括90-100bp、100-110bp、110-120bp、120-130bp、130-140bp、140-150bp、150-160bp、160-170bp、170-180bp及330-390bp。

百度查询: 北京橡鑫生物科技有限公司 天津橡鑫生物科技有限公司 北京橡鑫医学科技有限公司 疾病筛查模型的构建方法、疾病筛查模型及筛查装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。