首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于多组学数据的癌症亚型分类方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:天津大学

摘要:本发明公开一种基于多组学数据的癌症亚型分类方法,包括以下步骤:S1.获取若干个组学数据,对每个组学数据进行预处理得到多组学数据集;S2.将组学数据划分为一个基准组学数据和若干个补充组学数据;S3.对每个组学数据独立地构建自编码器,并通过重构损失进行优化,实现初级特征提取得到多组学低维特征矩阵;S4.将基准组学自编码器和每个补充组学自编码器进行组合,得到耦合的自编码器对,对多组学低维特征矩阵进行二次特征提取得到跨组学共享特征矩阵;S5.对跨组学共享特征矩阵进行串联拼接操作得到多组学集成特征矩阵;S6.构建由深度神经网络组成的亚型聚类块,将多组学集成特征矩阵输入进亚型聚类块,最后输出样本所述亚型类别。

主权项:1.一种基于多组学数据的癌症亚型分类方法,其特征在于,用于实现基于多组学数据整合的端到端识别癌症亚型的过程,具体包括以下步骤:S1.获取癌症的若干个组学数据,对每个组学数据进行预处理,得到多组学数据集;预处理方式包括缺失值处理、变量筛选和标准化;S2.将多组学数据集内的组学数据划分为一个基准组学数据Omicst和若干个补充组学数据Omicsm;S3.对多组学数据集内的每个组学数据独立地构建自编码器,并通过重构损失进行优化,实现初级特征提取,得到一组新的多组学低维特征矩阵;其中所有自编码器共同组成了跨组学集成自编码器;基准组学数据构建的自编码器称为基准组学自编码器,补充组学数据构建的自编码器称为补充组学自编码器;对补充组学自编码器进行初级特征提取得到补充组学低维特征矩阵;所有的自编码器包括编码器和解码器;S4.将基准组学自编码器和每个补充组学自编码器进行组合,得到若干个耦合的自编码器对,通过自编码器对对多组学低维特征矩阵进行二次特征提取得到跨组学共享特征矩阵;S5.将步骤S4获得的跨组学共享特征矩阵进行串联拼接操作得到多组学集成特征矩阵,作为亚型聚类块的输入;该过程的公式表示如下:z=concatz1→t,z2→t,...zm→t,...,zM→t,m≠t其中concat·代表串联算子,M为组学数据个数,zm→t代表组学数据m与组学数据t之间的跨组学共享特征矩阵;z为多组学集成特征矩阵,该矩阵的行代表样本,列代表特征;S6.构建由深度神经网络组成的亚型聚类块,将步骤S5获得的多组学集成特征矩阵z输入进亚型聚类块,通过在数据对的列空间内执行对比学习,来优化样本的类间关系,得到亚型软标签矩阵。

全文数据:

权利要求:

百度查询: 天津大学 一种基于多组学数据的癌症亚型分类方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。