买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:江西省农业科学院园艺研究所
摘要:本发明提供一种植物线粒体重组开放阅读框的鉴定及表达检测方法和系统,方法主要包括:通过已知植物线粒体保守基因序列注释保守基因序列,结合保守基因序列在开放阅读框中进一步鉴定嵌合基因相关的重组开放阅读框,提取嵌合基因保守序列的插入位置和长度的基本信息,通过植物线粒体序列信息,加上得到的开放阅读框和嵌合基因保守序列信息来构建基因结构注释文件,利用植物线粒体基因组序列加上转录组测序数据生成比对文件,两个文件根据植物线粒体基因组序列进行归一化处理;本发明最终得到重组开放阅读框的相对表达水平结果,准确性高。
主权项:1.一种植物线粒体重组开放阅读框的鉴定及表达检测方法,其特征在于,包括如下步骤:S1、导入待分析植物线粒体基因序列和已知植物线粒体保守基因序列;S2、在所述待分析植物线粒体基因序列中确定存在的开放阅读框,将所述已知植物线粒体保守基因序列和所述待分析植物线粒体基因序列进行比对,得到保守基因序列,通过所述保守基因序列在所有的开放阅读框中确定线粒体嵌合基因和保守基因位置;所述待分析植物线粒体基因序列为预先由高通量测序仪器产生的测序数据;所述S2具体为,将所述测序数据组装成多个连续序列组装本;将所述已知植物线粒体保守基因序列与多个所述连续序列组装本进行相互比对,找到同源区域,根据所述同源区域的重叠区域确定成环序列;在所述成环序列中确定存在的开放阅读框;将所述已知植物线粒体保守基因序列比对到所述待分析植物线粒体基因序列上,得到保守基因序列;通过所述保守基因序列在所有存在的开放阅读框确定线粒体嵌合基因和保守基因位置;S3、通过已知植物线粒体保守基因序列注释所述保守基因序列,通过注释后的保守基因序列对所述待分析植物线粒体基因序列中与保守基因有关的线粒体嵌合基因进行鉴定,得到插入序列基本信息和多个待表达的线粒体嵌合基因;所述S3具体为:按照设定窗口长度和设定步长将所述保守基因序列分割为多个片段,将每个所述片段比对到待分析植物线粒体基因组序列上进行重组,得到同源比对结果和重组的线粒体基因组序列;根据所述同源比对结果从所述重组的线粒体基因组序列中提取与保守基因有关的嵌合基因位置信息,所述嵌合基因位置信息包括嵌合基因中保守序列以及嵌合基因中保守序列的起始位置和终止位置;根据所述嵌合基因中保守序列的起始位置和终止位置提取所述线粒体基因组序列在嵌合基因中保守序列上游5Kb和保守序列下游5Kb的序列,得到待分析片段;利用ORFfinder工具对所述待分析片段进行开放阅读框鉴定,得到插入序列基本信息和多个待表达的线粒体嵌合基因;S4、通过所述保守基因位置对应的插入序列基本信息从多个待表达的线粒体嵌合基因中提取嵌合基因保守序列,通过所述嵌合基因保守序列来构建基因结构注释文件;所述S4具体为:将所述多个待表达的线粒体嵌合基因划分为长度为S的多个假定基因结构;根据所述保守基因位置对应的插入序列基本信息从多个待表达的线粒体嵌合基因中提取嵌合基因保守序列,所述嵌合基因保守序列的长度为K,将长度为K的嵌合基因保守序列加入到多个假定基因结构中,得到基因结构注释文件;S5、导入与所述待分析植物线粒体基因序列相关的转录组测序数据,将所述转录组测序数据比对到所述待分析植物线粒体基因组序列上,生成比对文件;S6、对所述基因结构注释文件和所述比对文件进行数据归一化处理,从而得到嵌合基因的相对表达水平结果;所述S6具体为:将所述基因结构注释文件和所述比对文件输入FeatureCounts工具中进行指定位置的序列比对,得到多个比对成功的序列,所述多个比对成功的序列包括比对成功的长度为S的假定基因结构的序列和长度为K的嵌合基因的序列;将长度为S的假定基因结构的序列数量除以长度S,并将长度为K的嵌合基因的序列数量除以长度K,得到优化处理后的序列数据;将优化处理后的序列数据输入scikit-learn工具中进行数据归一化处理,从而得到嵌合基因的相对表达水平结果。
全文数据:
权利要求:
百度查询: 江西省农业科学院园艺研究所 植物线粒体重组开放阅读框的鉴定及表达检测方法和系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。