安徽大学谷红仓获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉安徽大学申请的专利基于血浆rDNA序列的甲基化信号癌症检测与溯源方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121393571B 。
龙图腾网通过国家知识产权局官网在2026-03-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511935818.7,技术领域涉及:G16B40/00;该发明授权基于血浆rDNA序列的甲基化信号癌症检测与溯源方法是由谷红仓;李晗;张帆;李浩设计研发完成,并于2025-12-22向国家知识产权局提交的专利申请。
本基于血浆rDNA序列的甲基化信号癌症检测与溯源方法在说明书摘要公布了:本发明公开了基于血浆rDNA序列的甲基化信号癌症检测与溯源方法,属于生物信息学和癌症诊断技术领域。本方法通过两次映射提取血浆中的rDNA序列,获取CpG甲基化信息和丰度信息作为输入,采用两层机器学习模型,模拟甲基化信号与癌症类型之间的关联关系,实现高灵敏度的癌症检测与溯源。构建该模型的目的是解决血浆中微量甲基化信号检测的灵敏度不足问题,实现高效可靠的癌症早期诊断与溯源分析。
本发明授权基于血浆rDNA序列的甲基化信号癌症检测与溯源方法在权利要求书中公布了:1.基于血浆rDNA序列的甲基化信号癌症检测与溯源方法,其特征在于,包括以下步骤: 步骤一、通过NCBI数据库下载两组参考基因组,分别为hg19.fa和U13369.1.fa,用于构建rDNA序列的映射参考,将所述参考基因组组装为融合参考基因组,用于血浆rDNA序列的二次映射; 步骤二、对训练集和验证集的血浆样本进行相同的预处理,获取每个样本中rDNA的丰度信息,并获取样本在每个CpG位点的rDNA甲基化信息; 步骤三、对步骤二提取的rDNA丰度信息构建2N的丰度信息矩阵,其中2表示rDNA序列丰度特征维度,N表示样本数量; 步骤四、对步骤二提取的rDNA甲基化信息,筛选CpG位点覆盖度10X以上的位点,并计算所述样本符合要求的CpG位点处的甲基化水平,构建TN的甲基化信息矩阵,其中T表示符合样本要求的CpG位点数量,N表示样本数量; 步骤五、采用五折交叉验证方法划分训练集和验证集,并构建两层机器学习模型,根据癌症检测和癌症溯源任务分别训练模型; 在步骤三中,统计的rDNA丰度信息基于原始数据与rDNA序列读数计数,计算每个样本的相对丰度,构建2N的信息矩阵,其中2表示rDNA序列丰度特征维度,N表示样本数量;步骤二中原始双端测序文件,统计来源于read1和read2文件的序列长度分布以及对应长度的DNA数量,步骤二中提取的rDNA数据,统计rDNA序列长度分布以及对应长度的rDNA数量;则一个样本的rDNA丰度计算公式为: ; 其中,L1i表示read1的序列长度分布,L2i表示read2的序列长度分布,Lri表示两次映射后rDNA的序列长度分布;A1i表示read1的序列长度对应的数量,A2i表示read2的序列长度对应的数量,Ari表示两次映射后rDNA的序列长度对应的数量; 步骤五包括以下子步骤: 1以步骤三获得的丰度信息矩阵和步骤四获得的甲基化信息矩阵作为输入特征,构建第一层模型,所述第一层模型包括随机森林和XGBoost模型; 2使用所述随机森林和XGBoost模型分别输出预测概率,通过软投票方式整合生成第一层预测概率; 3将子步骤2生成的第一层预测概率作为输入,构建第二层逻辑回归模型,分别训练癌症检测模型和癌症溯源模型,输出各自的最终预测概率。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人安徽大学,其通讯地址为:230601 安徽省合肥市经济技术开发区九龙路111号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励