Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

在单细胞微生物基因组测序结果中区分菌株的方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:墨卓生物科技(浙江)有限公司

摘要:本发明提供了一种在单细胞微生物基因组测序结果中区分菌株的方法。本发明首先基于不同位点SNP的检测深度、突变数量及基因的多样性等预设过滤条件对SAG的SNP信息进行精细过滤以获得含有特征SNP的特征矩阵,根据特征矩阵对SAG进行层次聚类后,利用可自动化确定最佳菌株数目的算法高通量地对层次聚类结果进行准确的菌株区分,再以每个SAG的比对率、覆盖度、相对覆盖比和有效覆盖比为依据,采用贪婪算法高效地从每个菌株的SAG集合中选择出最优的SAG组装集合,经组装后获得具有高完整度低污染度的高质量菌株级别基因组序列。

主权项:1.在单细胞微生物基因组测序结果中区分菌株的方法,其特征在于,包括如下步骤:S1.将每个SAG比对至物种基因组,获得每个SAG相对于物种基因组的SNP;S2.将所有SAG的SNP进行合并,获得SNP初步矩阵,根据预设过滤条件对SNP初步矩阵中的SNP进行过滤,获得含有特征SNP的特征矩阵;S3.根据特征SNP对SAG进行层次聚类,将层次聚类结果按不同菌株数目进行划分,以WSS分数作为评价指标对每一划分结果进行评价,根据评价结果确定最佳菌株数目;S4.按最佳菌株数目对层次聚类结果进行划分,获取每个菌株的SAG集合;S5.计算每个菌株的SAG集合中每个SAG比对至物种基因组的覆盖度;S6.根据每个SAG的比对率、覆盖度、相对覆盖比、有效覆盖比,使用贪婪算法从SAG集合中筛选出用于菌株组装的SAG,获得SAG组装集合;S7.对SAG组装集合中的reads进行组装,得到对应菌株的基因组序列;其中,步骤S6包括:S6-1.设定SAG组装集合的初始化状态,在第一轮循环中,选取当前SAG集合中覆盖度最大的p号SAG加入SAG组装集合,合并覆盖区域,获得第一轮的SAG组装集合;或在当前非第一轮循环中,选取当前SAG集合中有效覆盖比最大的p号SAG加入上一轮循环中S6-3获得的SAG组装集合,合并覆盖区域,获得当前轮的SAG组装集合;S6-2.分别计算当前每一个未纳入SAG组装集合的q号SAG的覆盖区域与p号SAG的覆盖区域的第一叠加长度,再根据第一叠加长度、p号SAG的覆盖区域的集合长度、p号SAG未比对至物种基因序列的reads长度,分别计算每一个未纳入SAG组装集合的q号SAG相对于p号SAG的相对覆盖比;S6-3.选取相对覆盖比最大的qmax号SAG加入至S6-1获得的SAG组装集合,合并覆盖区域,迭代获得当前轮的SAG组装集合;S6-4.分别计算当前每一个未纳入SAG组装集合的q’号SAG的覆盖区域与S6-3获得的SAG组装集合的覆盖区域的第二叠加长度,再根据第二叠加长度、S6-3获得的SAG组装集合的覆盖区域的集合长度、p号SAG未比对至物种基因序列的reads长度,分别计算当前每一个未纳入SAG组装集合的q’号SAG相对于p号SAG的有效覆盖比;S6-5.循环执行步骤S6-1至S6-4直至满足预设组装条件,获得SAG组装集合;其中,所述预设组装条件根据SAG组装集合的覆盖总长度、SAG组装集合的SAG数量、纳入SAG组装集合的SAG的比对率进行设定。

全文数据:

权利要求:

百度查询: 墨卓生物科技(浙江)有限公司 在单细胞微生物基因组测序结果中区分菌株的方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。