首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于多组学数据识别癌症亚型的方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:天津大学

摘要:本发明公开了一种基于多组学数据识别癌症亚型的方法,所述方法是基于核主成分分析的多核聚类预测模型KpcaMKL,所述预测模型通过如下步骤生成:步骤1:通过癌症基因组图谱数据库TheCancerGenomeAtlas,TCGA构建癌症多组学数据集;步骤2:通过核主成分分析算法对癌症数据集中的各个组学数据进行特征提取;步骤3:通过高斯核函数对降维后的数据进行核变换得到对应的核矩阵;步骤4:将各个核矩阵平均加权融合为一个全局特征矩阵;步骤5:将全局特征矩阵运用到谱聚类算法中,得到的聚类结果即代表癌症的不同亚型;本发明解决了癌症亚型的识别问题,采用基于核PCA的多核聚类方法进行预测,明显提高了预测能力。

主权项:1.一种基于多组学数据识别癌症亚型的方法,其特征在于:所述方法基于核主成分分析构建的多核聚类预测模型,所述预测模型通过如下步骤生成:步骤1:通过TCGA数据库构建癌症多组学数据集;步骤2:通过核PCA算法对癌症数据集中的各个组学数据进行低维特征信息获取;所述步骤2中获取各组学数据的低维特征信息采用如下步骤生成:2.1、对于某个包含n个病人、k维特征的组学数据Xp,有: 2.2、使用基于如下多项式核函数的核PCA对Xp进行特征提取:Kpolyxi,xj=γxi,xj+rd其中,xi、xj均为取自Xp的样本向量0i、jn,参数γ、r、d分别取值1、1、3,随后得到包含n个病人、k′维特征的矩阵Xp′,有: 步骤3:通过高斯核函数对降维后的数据进行核变换得到对应的核矩阵Mp;步骤4:将各个核矩阵平均加权融合为一个具有癌症表征的全局特征矩阵M; 其中,s为使用的组学数据的个数;步骤5:将全局特征矩阵运用到谱聚类算法中获得的聚类结果即代表癌症的不同亚型;所述步骤5最终将全局特征矩阵M运用到谱聚类算法中,得到的聚类结果即代表癌症的不同亚型过程:5.1、根据M计算出拉普拉斯矩阵L并构造标准拉普拉斯矩阵L′=D-12LD-12;D是对角矩阵,其对角元素的值分别对应着矩阵M的各行元素之和;5.2、计算出矩阵L′的特征值对应的特征向量y,将特征向量y组成的矩阵按行标准化形成特征矩阵Y;5.3、矩阵Y的每一行作为一个样本,采用K-means方法进行聚类,得到不同的划分,每个划分代表着一个亚型;其整个过程可以转化为求解优化问题: 其中,Y是D-12LD-12的特征值对应的特征矩阵,D是矩阵M对应的度矩阵,L是矩阵M对应的拉普拉斯矩阵。

全文数据:

权利要求:

百度查询: 天津大学 一种基于多组学数据识别癌症亚型的方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术