买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:广州序科码生物技术有限责任公司;潘星华
摘要:本发明公开了一种基于密度曲线的DNA拷贝数的检测方法及系统,涉及生物信息学技术领域,该方法包括以下步骤:分选单细胞或群体细胞后用全基因组预扩增或无预扩增所产生的DNA来构建测序文库;在特定分辨率下计算每个原始DNA测序数据的拷贝数信号值SNrcSegmentedNormalizedreadcounts;然后计算SNrc值的局部密度Localdensity并以此绘制密度曲线图;在密度图中找出主峰区Majorpeakzone和缓冲区Bufferzone分别作为整数型拷贝数Integercopynumber和模糊值Fuzzyvalue。其中模糊值用以判断群体细胞组织样品中是否出现异质性或嵌合体,或单细胞样品是否出现游离DNA污染等问题。该方法提高了DNA拷贝数变异CNV判定的客观性和精准度。
主权项:1.一种基于密度曲线的DNA拷贝数检测方法,所述方法用于染色体的拷贝数识别,其特征在于,包括如下步骤:S1、将测序数据过滤,进行上游分析,输出原始数据;S2、把相应生物的基因组划分为不重叠的窗口,所述窗口作为一个分割单位,称为一个bin区;S3、统计每个bin区的reads读数,得到原始覆盖数bincount;S4、将bincount进行归一化处理,生成标准化的拷贝数Nrc值Normalizedreadcount;S5、通过算法工具,将具有近似Nrc值Normalizedreadcount的连续bin区划分为同一个segment,并将拷贝数信号值SNrcSegmentedNormalizedreadcounts作为能代表该segment区的所有Nrc的集中趋势的量数;S6、对不同预设分辨率的拷贝数信号值SNrc数据进行打分,并根据经验设定的阈值cutoff为标准,对符合标准的合格SNrc数据进行下一步分析;S7、计算拷贝数信号值SNrc的局部密度localdensity并以此绘制密度曲线图;S8、基于密度曲线图来找出主峰区Majorpeakzone和缓冲区Bufferzone分别作为整数型拷贝数Integercopynumber和模糊值Fuzzyvalue。
全文数据:
权利要求:
百度查询: 广州序科码生物技术有限责任公司 潘星华 一种基于密度曲线的DNA拷贝数检测方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。