买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:浙江工业大学
摘要:本发明公开一种基于大数据预测核心微生物组的方法,该方法基于公共数据库中可获取的16SrRNA基因高通量测序数据,通过对所有独立实验的测序数据的质控、过滤、合并和注释,得到归一化的微生物数据表格,从中获取每个物种基于独立实验数和样本数的检出频率以及每个微生物物种的相对丰度。通过整合和量化这几个因子构建物种的核心指数计算公式,从而确定某一类微生物群落的核心微生物组。本发明方法基于公开的16SrRNA基因测序数据库,能够便捷预测环境中相似类型环境介质和亲缘宿主相关的核心微生物组,且呈现较高可信度,可广泛应用于微生物研究体系的预测,增加研究的普适性。
主权项:1.一种基于大数据预测核心微生物组的方法,其特征在于,所述方法包括如下步骤:1确定目标系微生物群落,根据关键词“目标+microbialcommunity”、“目标+16SrRNA”、“目标+microbiome”和“目标+microbiota”检索文献,找到相关独立实验,整合所有获取的文献内容以及确定数据集的可获取性和可利用性;2通过统计整合后的数据集信息表格,得到每个独立实验的实验信息,统一在线数据库获取每个独立实验的测序原始数据;3分析对每个独立实验的测序原始数据进行质量过滤、双端合并、样品合并、序列去冗余、聚类并且去除嵌合体,得到每个物种序列数和OTU表格;4将每个独立实验得到的序列和OTU表格导入QIIME2中进行不同实验的数据合并、物种注释、宿主序列去除和序列抽平,获得归一化分类物种表格和每个物种的检出序列数;5选取一个物种分类水平作为核心微生物组的基础分类,从步骤4得到的归一化分类物种表格中筛选出每个独立实验检出的物种在该独立实验所有样品中的检出频率大于50%,然后根据这些物种进行计算所有独立实验中的检出频率;6以获取的所有独立实验的样品数为基础,计算每个物种的检出频率;7根据步骤4得到的每个物种的检出序列数除以步骤4中抽平的序列数计算出每个物种的相对丰度;8根据步骤5~步骤7中计算的指标整合计算每个物种的核心指数,根据公式计算: 其中,CI是16SrRNA测序元数据中每个物种的核心指数,f是每个物种在所有样本中的检出频率,n是包含每个物种的独立实验数量,s是每个物种在所有样本中的序列数,N是独立实验的总数,S是所有样本的总序列数即步骤4中抽平的序列数,sS是每个物种的相对丰度;9将目标微生物群落的物种核心指数归一化,根据公式计算: 其中,NorCI是归一化后的目标微生物群落的物种核心指数,CImin和CImax分别是目标微生物群的最小和最大CI;10为了同时保证步骤5中计算的100%独立实验中的检出频率,95%的所有样本的检出频率和前1%丰富度,将NorCI0.8的物种定义为该目标微生物群落的核心物种。
全文数据:
权利要求:
百度查询: 浙江工业大学 一种基于大数据预测核心微生物组的方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。