买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:湖南大学
摘要:本发明公开了一种基于泛基因组图对宏基因组数据进行菌株水平分类的方法,首先,通过泛基因组图的技术捕获了每个物种的多个菌株的基因组作为参考,而不仅仅是使用每个物种的代表基因组作为参考,菌株多样性的扩展,增强了宏基因组测序读段的比对准确性和在菌株水平上组成的估计;然后,通过在NGS和TGS宏基因组数据与泛基因组图的比对中,分别使用相应的短读长比对工具Giraffe和长读长比对工具GraphAligner,从而可以同时高效处理两种类型的数据;最后,通过对物种水平分类结果进一步基于泛基因组图进行路径丰度优化处理,从而能够实现多物种菌株水平分类。本发明能够解决现有方法由于单一参考基因组的策略,导致菌株水平分类能力受到限制的技术问题。
主权项:1.一种基于泛基因组图对宏基因组数据进行菌株水平的方法,其特征在于,包括如下步骤:1从公共数据库获取多个物种及其对应的多个完整基因组,并根据获取的所有完整基因组构建参考数据库。2针对步骤1得到的参考数据库中的每个物种而言,使用该物种在该参考数据库中对应的所有参考基因组构建该物种对应的泛基因组图,并将所有物种对应的泛基因组图进行合并,以得到参考泛基因组图。3获取用户输入的宏基因组数据,将步骤2得到的参考泛基因组图与该宏基因组数据进行比对,以得到该宏基因组数据中每条测序读段的多条比对结果。4根据步骤3得到的宏基因组数据中每条测序读段的所有比对结果进行物种水平分类分箱处理,以得到该宏基因组数据对应的最终物种组成。5针对步骤4得到的宏基因组数据对应的最终物种组成中的每个物种而言,对该物种进行物种水平分类谱分析处理,以获取该物种的相对丰度。6针对步骤4得到的宏基因组数据对应的最终物种组成中的每个物种而言,根据步骤2得到的该物种对应的泛基因组图对该物种进行路径丰度优化PAO处理,以得到宏基因组数据的最终菌株组成、以及该最终菌株组成中每个菌株的绝对丰度。7根据步骤4得到的宏基因组数据对应的最终物种组成对步骤6得到的宏基因组数据的最终菌株组成、以及该最终菌株组成中每个菌株的绝对丰度进行丰度调整和归一化计算,以得到宏基因组数据的最终菌株组成、以及该最终菌株组成中每个菌株的相对丰度。
全文数据:
权利要求:
百度查询: 湖南大学 一种基于泛基因组图对宏基因组数据进行菌株水平分类的方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。