买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明公开一种基于双端测序的碱基质量分数校正方法及程序产品、设备及存储介质,所述方法包括:获取双端测序文件,并获取每条测序片段对应的第一序列数据及第二序列数据;基于第一序列数据及第二序列数据,获取每条测序片段的重叠区域中碱基的碱基信息,并从候选特征中确定显著性特征;基于所述显著性特征及所述估计碱基质量分数,对碱基数据进行碱基数据组,得到多个碱基数据组,基于每个碱基数据组中碱基的碱基信息,计算得到每个碱基数据组对应的原始碱基质量分数;基于每个碱基数据组对应的原始碱基质量分数及显著性特征,拟合得到碱基质量分数校正模型,并基于碱基质量分数校正模型,计算得到每个碱基数据组内每个碱基的拟合碱基质量分数。
主权项:1.一种基于双端测序的碱基质量分数校正方法,其特征在于,包括:获取双端测序文件,并从所述双端测序文件中获取每条测序片段对应的第一序列数据及第二序列数据;其中第一序列数据是从测序片段的第一端向第二端测序得到的碱基序列数据,第二序列数据是从测序片段的第二端向第一端测序得到的碱基序列数据;基于每条测序片段对应的第一序列数据及第二序列数据,获取每条测序片段的重叠区域中碱基的碱基信息;所述碱基信息包括从所述双端测序文件中获取的估计碱基质量分数,及与所述估计碱基质量分数关联的候选特征;基于每条测序片段的重叠区域中碱基的碱基信息,从所述候选特征中确定与所述估计碱基质量分数的关联度满足预设条件的显著性特征;基于所述显著性特征及所述估计碱基质量分数,对所述双端测序文件中的碱基数据进行分组,得到多个碱基数据组,获取每个碱基数据组中碱基的碱基信息,基于每个碱基数据组中碱基的碱基信息计算得到每个碱基数据组对应的原始碱基质量分数;基于每个碱基数据组对应的所述原始碱基质量分数及每个碱基数据组的碱基信息中的显著性特征,拟合得到碱基质量分数校正模型,并基于碱基质量分数校正模型,计算得到每个碱基数据组内每个碱基的拟合碱基质量分数。
全文数据:
权利要求:
百度查询: 深圳赛陆医疗科技有限公司 基于双端测序的碱基质量分数校正方法及程序产品、设备及存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。