买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:北京贝瑞和康生物技术有限公司
摘要:本发明提供一种基因组拷贝数变异检测方法,所述方法包括:获取待测样品的基因组测序序列;将测序序列比对到人类基因组参考序列上,并确定唯一比对至基因组参考序列的位置;将基因组参考序列划分为等长窗口,统计落入每个窗口的唯一比对的测序序列数目,得到每个窗口的有效数据量;对每个窗口的有效数据量进行动态数据校正,得到每个窗口校正后的有效数据量;将校正后的有效数据量标准化,得到每个窗口的有效深度值;使用FusedLasso算法过滤噪音,并通过对差分项的约束识别潜在的拷贝数变异区域;计算潜在的拷贝数变异区域内的拷贝数值SCN,并与拷贝数的参考范围进行比较,得到准确的拷贝数变异检测结果。本发明还提供用于实施上述方法的装置和设备。本发明首次建立了计算拷贝数值SCN的数学模型,并确定了基因组区域拷贝数状态的参考区间。此外,本发明能有效地处理测序数据中的噪音,准确地识别拷贝数变异区域。
主权项:1.一种拷贝数变异的检测装置,包括:--序列获取单元,用于获取待测样品的基因组测序序列;--序列比对单元,用于将测序序列比对到人类基因组参考序列上,并确定唯一比对至基因组参考序列的位置;--有效数据量统计单元,用于将基因组参考序列划分为等长窗口,并统计落入每个窗口的唯一比对的测序序列数目,得到每个窗口的有效数据量;--有效数据量校正单元,用于将每个窗口的有效数据量进行动态数据校正,得到每个窗口校正后的有效数据量,其中所述校正包括GC校正、比对率校正和数据量校正;--有效数据量标准化单元,用于将校正后的有效数据量标准化,得到每个窗口的有效深度值CR,其中所述标准化通过与对照集比较进行,其中所述对照集是指来自于一定规模的阴性样品的每个窗口校正后的有效数据量的均值;--拷贝数变异区域识别单元,用于使用FusedLasso算法通过对差分项的约束获得过滤噪音后的有效深度值,再通过一阶差分算法对所述过滤噪音后的有效深度值的变异趋势进行检测,以识别潜在的拷贝数变异区域,其中所述FusedLasso算法根据以下公式拟合: 其中,X:X=I,I为单位矩阵,y为每个窗口的有效深度值CR,β为待估计参数,为降噪处理后的有效深度值,λ1和λ2分别为变量和差分项的L1正则项,其中所述λ值通过K-Fold交叉验证获得;--拷贝数计算单元,用于根据以下公式计算潜在的拷贝数变异区域内的拷贝数值SCN:SCN=CR*×CNNorm,其中,CR*为该潜在的拷贝数变异区域内的有效深度值,CNNorm是指阴性样品中该潜在的拷贝数变异区域的理论拷贝数值,对于常染色体及女性的X染色体该值为2,对男性的性染色体该值为1;--检测结果输出单元,用于将SCN与拷贝数值的参考范围进行比较,并输出准确的拷贝数变异检测结果,其中所述拷贝数值的参考范围通过以下计算:利用数学统计模型,对已知拷贝数状态的一定规模样品的拷贝数状态及其对应的拷贝数值进行统计建模,然后按照99%的显著性水平计算出不同拷贝数状态对应的拷贝数值参考范围。
全文数据:
权利要求:
百度查询: 北京贝瑞和康生物技术有限公司 一种基因组拷贝数变异的检测方法和装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。