买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明涉及生物信息领域二代测序数据分析技术领域,具体涉及一种转座子插入人基因组突变模式和转座印迹的检测方法,本发明对转座子插入位点和导致的基因组变异进行全面检测,可以在单个实验中高效、快速地获得全基因组的信息,并且可以识别转座子插入点周围的基因组序列;本发明充分利用比对到带有softclip的reads信息,即包括reads中同时可以比对到人基因组和转座子序列,reads中比对到相同染色体且有基因组删除的片段序列,检测转座子插入到人基因组是否完美插入,是否引起插入位点附近基因组的重复或删除片段以及转座印迹,同时可以快速准确地识别转座子插入位点和其可能导致的插入位点附近基因组重复和删除片段以及转座印迹。
主权项:1.一种转座子插入人基因组突变模式和转座印迹的检测方法,其特征在于,所述检测方法包括以下步骤:步骤1、将测序获得的reads即测序读段分别比对到人基因组和转座子序列中,在对比中,同时考虑了覆盖人基因组和转座子序列的测序读段,比对到相同染色体且有softclip即有片段缺失的测序读段;步骤2、根据得到的跨越人基因组和转座子序列的比对文件信息,根据比对文件的第六列的CIGAR值,分别判断转座子插入人基因组引起的突变类型;步骤3、整理所有得到的同时跨越人基因组和转座子序列的比对信息,提取所有的RB断点和LB断点集合,根据比对上的染色体和基因组坐标,合并断点集合,判断断点集合是否完美插入,判断是否存在插入位点附近基因组的重复现象,判断是否存在插入位点附近基因组的删除片段,其次,根据比对到相同染色体且存在softclip即有片段缺失的测序读段,检测转座印迹现象,最终得到所有非完美的转座和潜在的转座印迹事件集合;所述步骤3的具体操作为:步骤3.1、假设reads1跨越人基因组和转座子序列,该断点集合为chrA:a且比对到基因组上的match值为D,比对到转座子序列上的softclip值为E,当|D-E|距离大于一定阈值时,提取|D-E|的序列信息,为未知的插入序列;步骤3.2、当步骤3.1中|D-E|距离小于一定阈值时认为完美插入;步骤3.3、当步骤3.1中|D-E|距离大于一定阈值,且该未知插入序列可以比对到该染色体基因组位点前后500bp的序列,即判断属于基因组中的重复,即潜在的由于转座子插入而引起的基因组重复现象;步骤3.4、假设reads2跨越人基因组和转座子序列,该断点集合为chrA:b,当ab且b-a大于一定的阈值时,认为在chrA上存在由于转座子的插入引入的插入位点基因组删除片段,删除片段长度为b-a;步骤3.5、当步骤3.1中|D-E|距离大于一定阈值,且该未知序列可以比对到其他的染色体或同一条染色体上一定阈值距离之外的位点信息,即判断潜在的由于转座子跳跃携带周围基因组再次插入导致的转座子印记现象;步骤3.6、假设reads3比对到相同染色体但是携带有softclip信息,且比对到基因组间的坐标距离大于一定的阈值,即认为该reads中测序得到的基因组片段存在缺失,若该染色体及基因组的坐标信息和步骤3.5中序列比对到的染色体相同,基因组坐标距离接近且小于一定阈值,则认为reads3中带有softclip导致的基因组缺失片段是由于潜在的转座子跳跃引起。
全文数据:
权利要求:
百度查询: 上海唯可生物科技有限公司 转座子插入人基因组突变模式和转座印迹的检测方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。