买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:苏州鸿晓生物科技有限公司
摘要:本申请公开了一种基于高度保守持家基因的种内多样性识别方法,其包括构建用于物种鉴定的高度保守持家基因数据库,以及基于高度保守持家基因数据库进行样品的种内多样性识别。本发明提出的方法可以有效对样品中的生物遗传序列进行重构,并且由于使用了NCBIRefSeq和高度保守持家基因结合构建的参考数据库,确保结果的特异性,进而同时克服了物种注释的过度假阴性和假阳性结果,提高了种内序列重建的全面性、分辨率和准确率。本申请还公开了对应的装置。
主权项:1.基于高度保守持家基因的种内多样性识别方法,其特征在于:包括构建用于物种鉴定的高度保守持家基因数据库,以及基于高度保守持家基因数据库进行样品的种内多样性识别;其中,构建用于物种鉴定的高度保守持家基因数据库包括:基于预定数量的代表基因组序列整理高度保守持家基因基因集;下载NCBIRefSeq数据库并获取对应的数据元信息;获得NCBIRefSeq代表基因组的高度保守持家基因数据集,形成高度保守持家基因数据库,包括获得仅包括NCBIRefSeq代表基因组的经压缩的NCBIRefSeq数据库,基于所述高度保守持家基因基因集,比对识别获得经压缩的NCBIRefSeq数据库中的每个代表基因组上的USCG基因家族;其中,基于高度保守持家基因数据库进行样品的种内多样性识别包括:对所述样品的宏基因组测序下机序列与USCG数据库进行比对得到比对结果;解析并过滤所述比对结果,得到每条测序结果序列比对到所述高度保守持家基因数据库的具体比对信息,所述具体比对信息测序结果序列的基因组编号和比对分数;通过所述基因组编号,结合高度保守持家基因数据库的物种分类信息得到对应的所述测序结果序列的物种注释;将所有测序结果的物种注释信息进行整合,挑选获得最多测序结果的比对分数支持的物种,计算该物种获得的测序结果支持数量,以及测序结果在高度保守持家基因基因上的覆盖分度,并且挑选预定数量的高度保守持家基因基因上获得覆盖的物种信息的物种作为在该样品中可能存在的潜在物种;针对每一个比对获得的潜在物种,将与该潜在物种相关的测序结果单独提取,并且重新比对至所有高度保守持家基因基因序列上;将所有比对结果按照高度保守持家基因基因序列上的坐标进行正序排序,并对每个坐标对应的碱基进行计算以重建高度保守持家基因基因序列;在高度保守持家基因的每个碱基位置上,计算在同一位置上的测序结果覆盖情况;如果一个位置上获得预定数量的测序结果覆盖,并且测序结果中有对同一个碱基的预定比例的支持,则认为该位置上有高质量的序列。
全文数据:
权利要求:
百度查询: 苏州鸿晓生物科技有限公司 基于高度保守持家基因的种内多样性识别方法和装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。