Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 哈尔滨工业大学卢振浩获国家专利权

哈尔滨工业大学卢振浩获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉哈尔滨工业大学申请的专利一种面向长读长RNA-seq测序数据的融合基因检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119763662B

龙图腾网通过国家知识产权局官网在2025-09-26发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411842245.9,技术领域涉及:G16B30/10;该发明授权一种面向长读长RNA-seq测序数据的融合基因检测方法是由卢振浩;杨宇航;刘亚东;姜涛;王亚东设计研发完成,并于2024-12-13向国家知识产权局提交的专利申请。

一种面向长读长RNA-seq测序数据的融合基因检测方法在说明书摘要公布了:一种面向长读长RNA‑seq测序数据的融合基因检测方法,本发明涉及面向长读长RNA‑seq测序数据的融合基因检测方法。本发明的目的是为了解决现有方法在多种人类癌症测序数据上识别融合基因过程计算资源占用过高,识别结果的准确性较低等问题。过程为:一:生成仅含转录本序列的重组参考转录本以及重组转录本注释;二:得到过滤后的测序片段;三:寻找融合基因对;四:得到断点还原后的每个融合基因对;对断点还原后的每个融合基因对的测序片段按照断点位置进行层次聚类,每个聚类簇为融合基因对;五:得到RNA‑seq比对结果;六:根据RNA‑seq比对结果,对四得到的融合基因对进行筛选,获得最终的融合基因对。本发明用于融合基因筛选领域。

本发明授权一种面向长读长RNA-seq测序数据的融合基因检测方法在权利要求书中公布了:1.一种面向长读长RNA-seq测序数据的融合基因检测方法,其特征在于:所述方法具体过程为: 步骤一:基于基因注释文件对参考序列进行重组,生成仅含转录本序列的重组参考转录本以及重组转录本注释; 步骤二:利用开源比对工具minimap2的DNA比对模式将待检测测序片段比对到重组参考转录本上,对比对上的待检测测序片段进行过滤,得到过滤后的测序片段; 过滤后的测序片段对应的基因组成基因全集G; 过滤后的测序片段中包含序列标识符flag; 步骤三:在过滤后的测序片段中,寻找融合基因对; 步骤四:对每个融合基因对进行断点还原处理,得到断点还原后的每个融合基因对; 对断点还原后的每个融合基因对的测序片段按照断点位置进行层次聚类,找出并保留测序片段数大于等于二的聚类簇,每个聚类簇为融合基因对; 步骤五:利用开源序列比对工具abpoa对每个聚类簇中的测序片段进行序列比对,输出一致性序列; 利用开源比对工具minimap2的RNA-seq比对功能,将一致性序列比对到步骤一的参考序列,得到RNA-seq比对结果; 步骤六:根据RNA-seq比对结果,对步骤四得到的融合基因对进行筛选,获得最终的融合基因对; 所述步骤一中基于基因注释文件对参考序列进行重组,生成仅含转录本序列的重组参考转录本以及重组转录本注释; 具体过程为: 步骤一一:读取基因注释文件,根据需求保留基因注释文件中转录本及保留的转录本对应的外显子的信息; 步骤一二:根据步骤一一保留的每个外显子的信息中的起始与结束位置以及参考序列,确定每个外显子的序列,将所有外显子的序列链接起来得到转录本序列; 步骤一三:将转录本序列按照染色体连接起来,得到重组参考转录本; 记录参考序列上的起始和结束位置,以及重组参考转录本的起始和结束位置,得到重组转录本注释; 步骤一四:用minimap2的index功能建立重组参考转录本和参考序列的比对索引; 所述步骤二中对比对上的待检测测序片段进行过滤,得到过滤后的测序片段; 具体过程为: 步骤二一:根据测序片段的序列长度进行过滤; 步骤二二:根据测序片段覆盖的基因数进行过滤; 步骤二三:根据步骤二二保留的每个测序片段的边界和对应重组参考转录本的外显子的边界进行过滤,得到过滤后的测序片段; 所述步骤三中在步骤二得到的过滤后的测序片段中,寻找融合基因对; 具体过程为: 步骤三一:假设步骤二得到的过滤后的测序片段为m条; 在确定基因全集G之后,基因全集中每个基因表示为一个m维的向量; geneα=qα1,qα2,…,qαm,whereqαβ=0or1,α∈[1,n],β∈[1,m] 其中,geneα表示第α个基因; qα1表示第α个基因相对于步骤二得到的过滤后的测序片段1的关联系数,步骤二得到的过滤后的测序片段1比对到第α个基因上,qα1取值为1;否则qα1取值为0; qα2表示第α个基因相对于步骤二得到的过滤后的测序片段2的关联系数,步骤二得到的过滤后的测序片段2比对到第α个基因上,qα2取值为1;否则qα2取值为0; qαm表示第α个基因相对于步骤二得到的过滤后的测序片段m的关联系数,步骤二得到的过滤后的测序片段m比对到第α个基因上,qαm取值为1;否则qαm取值为0; β表示步骤二得到的过滤后的测序片段的序号; n表示基因全集G中基因总数; m表示步骤二得到的过滤后的测序片段总数; 步骤三二:基于n个基因得到一个n×m维的矩阵Qn×m; 其中,Qn×m表示n×m维的矩阵; gene1表示第1个基因,gene2表示第2个基因,genen表示第n个基因; q11表示第1个基因相对于步骤二得到的过滤后的测序片段1的关联系数,步骤二得到的过滤后的测序片段1比对到第1个基因上,q11取值为1;否则q11取值为0; q12表示第1个基因相对于步骤二得到的过滤后的测序片段2的关联系数,步骤二得到的过滤后的测序片段2比对到第1个基因上,q12取值为1;否则q12取值为0; q1m表示第1个基因相对于步骤二得到的过滤后的测序片段m的关联系数,步骤二得到的过滤后的测序片段m比对到第1个基因上,q1m取值为1;否则q1m取值为0; q21表示第2个基因相对于步骤二得到的过滤后的测序片段1的关联系数,步骤二得到的过滤后的测序片段1比对到第2个基因上,q21取值为1;否则q21取值为0; q22表示第2个基因相对于步骤二得到的过滤后的测序片段2的关联系数,步骤二得到的过滤后的测序片段2比对到第2个基因上,q22取值为1;否则q22取值为0; q2m表示第2个基因相对于步骤二得到的过滤后的测序片段m的关联系数,步骤二得到的过滤后的测序片段m比对到第2个基因上,q2m取值为1;否则q2m取值为0; qn1表示第n个基因相对于步骤二得到的过滤后的测序片段1的关联系数,步骤二得到的过滤后的测序片段1比对到第n个基因上,qn1取值为1;否则qn1取值为0; qn2表示第n个基因相对于步骤二得到的过滤后的测序片段2的关联系数,步骤二得到的过滤后的测序片段2比对到第n个基因上,qn2取值为1;否则qn2取值为0; qnm表示第n个基因相对于步骤二得到的过滤后的测序片段m的关联系数,步骤二得到的过滤后的测序片段m比对到第n个基因上,qnm取值为1;否则qnm取值为0; 步骤三三:将n×m维的矩阵Qn×m与Qn×m的转置相乘,得到一个n×n维的对称矩阵Rn×n; 其中,Rn×n表示n×n维的对称矩阵;rαα′表示对称矩阵Rn×n中的项; qαβ表示矩阵Qn×m中第α个基因相对于步骤二得到的过滤后的测序片段β的关联系数,步骤二得到的过滤后的测序片段β比对到第α个基因上,qαβ取值为1;否则qαβ取值为0; qα′β表示Qn×m中第α′个基因相对于步骤二得到的过滤后的测序片段β的关联系数,步骤二得到的过滤后的测序片段β比对到第α′个基因上,qα′β取值为1;否则qα′β取值为0;α′∈[1,n]; q′βα′表示中第α′个基因相对于步骤二得到的过滤后的测序片段β的关联系数,步骤二得到的过滤后的测序片段β比对到第α′个基因上,q′βα′取值为1;否则q′βα′取值为0;α′∈1,n];β∈[1,m]; 步骤三四:对称矩阵Rn×n中每个不在对角线上的项rαα′代表支持基因α和基因α′存在融合的测序片段数; 遍历对称矩阵Rn×n即可找出所有存在融合的融合基因对; 所述步骤四中对每个融合基因对进行断点还原处理,得到断点还原后的每个融合基因对; 对断点还原后的每个融合基因对的测序片段按照断点位置进行层次聚类,找出并保留测序片段数大于等于二的聚类簇,每个聚类簇为融合基因对; 具体过程为: 步骤四一:对每个融合基因对进行断点还原处理,得到断点还原后的每个融合基因对;具体过程为: 断点分为两种情况,后端断点和前端断点; 假定基因g1在前,基因g2在后; 基因g1对应的测序片段的flag=0为后端断点; 基因g2对应的测序片段的flag=16为后端断点; 基因g1对应的测序片段的flag=16为前端断点; 基因g2对应的测序片段的flag=0为前端断点; 对后端断点进行还原;具体过程为: 通过将步骤二过滤后的测序片段的断点位置和对应步骤一重组参考转录本的外显子的终止位置作差; 如果差值绝对值小于阈值,则认为断点属于对应步骤一重组参考转录本的外显子,将断点位置还原到参考序列上;表达式为: posref=postrans-exontrans+exonref 其中,postrans表示步骤二过滤后的测序片段的断点位置;exontrans表示对应步骤一重组参考转录本的外显子的终止位置,exonref表示参考序列的外显子的终止位置,posref表示参考序列上的断点位置; 如果差值绝对值大于等于阈值,则认为断点不属于对应步骤一重组参考转录本的外显子,将对应融合基因对过滤; 所述对前端断点进行还原;具体过程为: 通过将步骤二过滤后的测序片段的断点位置和对应步骤一重组参考转录本的外显子的起始位置作差; 如果差值绝对值小于阈值,则认为断点属于对应步骤一重组参考转录本的外显子,将断点位置还原到参考序列上;表达式为: posref=postrans-exon′trans+exon′ref 其中,postrans表示步骤二过滤后的测序片段的断点位置;exon′trans表示对应步骤一重组参考转录本的外显子的起始位置,exon′ref表示参考序列的外显子的起始位置,posref表示参考序列上的断点位置; 如果差值绝对值大于等于阈值,则认为断点不属于对应步骤一重组参考转录本的外显子,将对应融合基因对过滤; 步骤四二:对断点还原后的每个融合基因对的测序片段按照断点位置进行层次聚类,找出并保留测序片段数大于等于二的聚类簇,每个聚类簇为融合基因对。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人哈尔滨工业大学,其通讯地址为:150001 黑龙江省哈尔滨市南岗区西大直街92号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。