首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于低深度WGS测序末端特征的癌症早期预测方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:北京求臻医学检验实验室有限公司

摘要:本发明涉及医学分子生物学技术领域,特别涉及基于低深度WGS测序末端特征的癌症早期预测方法,通过采集健康人群与肿瘤人群样本,同时提取和统计样本cfDNA片段末端特征及break‑point末端特征,全面地考虑了不同长度和不同位置的片段末端特征,并利用优化的Mscore算法,更简便区分健康人组和癌症病人组,且在不同数据量的情况下仍能保持高稳定性。

主权项:1.基于低深度WGS测序末端特征的癌症早期预测方法,其特征在于包括以下步骤:S1.对样品进行基因靶向测序,获取原始fastq文件;S2.对原始fastq文件进行数据控制,筛除低质量数据,质量控制条件为:样品的测序深度不低于5×,碱基错误低于0.1%的碱基占总碱基数的比例大于90%,比对到基因组上的reads占所用reads的比例大于95%,测序结果对基因组序列的覆盖度大于90%;S3.将质控后的fastq文件比对参考基因组获得bam文件,对bam文件进行数据过滤,去除重复序列;S4.分别统计cfDNA片段末端特征、break-point末端特征的数量和比例,cfDNA片段末端特征数量和比例统计方法为:从每条read的正链及负链的5’端的4-6bp的末端,分别取4-6bp长度的末端序列片段,统计序列末端序列片段的数量和占比;break-point末端特征的数量和比例统计方法为:从每条read的负链5’端取2bp和3bp的末端序列片段,从参考基因组与read的负链5’端衔接端取2bp和3bp序列,将二者拼接得到4bp和6bp的break-point特征序列,统计break-point特征序列的数量和占比;S5.计算用于区分癌症病人的Mscore值,具体为:基于S4得到的样本cfDNA片段末端特征及break-point末端特征的数量和比例,用LASSO法筛选出motif,采用式1计算第i个样品的Mscore值式1其中,tij表示极差法得到的样品i的第j个motif的归一化的比例值;m为筛选出的motif数量;Wj为motifj的重要性;所述tij采用式2计算:式2其中,Pij是样品i的第j个motif的比例,i代表所有样品中的第i个样品,j代表所有motif中的第j个motif,对第i个样品的第j个motif;由随机森林得到的每个motifj权重wj,当≥0时,Wj=wj;当<0时,Wj=-wj; 式3其中,是第j个motif的比例的均值在健康组和肿瘤组之间的差值;nh表示健康人样品的数量,nt表示肿瘤样品的数量,ih表示第i个健康人样品,it表示第i个肿瘤样品,Pihj是健康人样品ih的第j个motif的比例,Pitj是肿瘤病人样品it的第j个motif的比例。

全文数据:

权利要求:

百度查询: 北京求臻医学检验实验室有限公司 基于低深度WGS测序末端特征的癌症早期预测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。