首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于肿瘤细胞系自监督学习的抗癌药物反应预测方法和装置 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:浙江大学温州研究院

摘要:本发明公开了一种基于肿瘤细胞系自监督学习的抗癌药物反应预测方法和装置,提出的基于预测式的自监督学习方式、基于对比式的自监督学习方式和基于原型对比式的自监督学习方式三种肿瘤细胞系的自监督学习方式可以被用于以MLPs、CNNs或者GNNs为核的任意一个抗癌药物反应预测模型。这些方式充分考虑了肿瘤细胞系基因组学与其他数据之间关联性、基因组学数据的鲁棒性和泛化性以及肿瘤细胞系数据集中潜在的层次结构化语义信息,能够使肿瘤细胞系编码器容纳多元化的生物信息,以全方面地考虑肿瘤细胞系的数据信息,从而实现更加精准的抗癌药物反应预测。

主权项:1.一种基于肿瘤细胞系自监督学习的抗癌药物反应预测方法,其特征在于,包括以下步骤:构建训练样本,包括肿瘤细胞系的基因组学数据、药物小分子数据、肿瘤细胞系对药物的反应情况数据;构建抗癌药物反应预测模型,包括肿瘤细胞系编码器、药物小分子编码器、抗癌药物反应预测解码器,其中,肿瘤细胞系编码器用于对基因组学数据进行特征提取以得到肿瘤细胞系表征,药物小分子编码器用于对药物小分子数据进行特征提取以得到药物小分子表征,抗癌药物反应预测解码器用于根据肿瘤细胞系表征和药物小分子表征进行预测,以得到肿瘤细胞系对药物小分子反应的预测结果;其中,当药物小分子数据为SMILES序列类型时,所述药物小分子编码器采用CNNs或者RNNs对SMILES序列对应的one-hots编码进行特征提取,以得到药物小分子表征;当药物小分子数据为2D分子图类型时,所述药物小分子编码器采用GNNs对由2D分子图构建的图结构进行特征提取,以药物小分子表征;利用训练样本对肿瘤细胞系编码器进行肿瘤细胞系自监督学习,以预训练肿瘤细胞系编码器,其中,自监督学习包括基于预测式的自监督学习,基于对比式的自监督学习,基于原型对比式的自监督学习;其中,利用训练样本对肿瘤细胞系编码器进行基于预测式的自监督学习,包括:设计辅助预测任务,并获取其他相关信息,包括性别、肿瘤来源、年龄、疾病和组织类型,以其他相关信息作为辅助预测任务的监督标签;利用肿瘤细胞系编码器对肿瘤细胞系的基因组学数据进行特征提取以得到肿瘤细胞系表征;利用非线性变换映射头对肿瘤细胞系表征进行映射变换后,再经过正则化处理得到预测结果;将预测结果与监督标签的交叉熵作为损失函数来监督训练肿瘤细胞系编码器;利用训练样本对肿瘤细胞系编码器进行基于对比式的自监督学习,包括:对肿瘤细胞系的基因组学数据进行数据增强,得到多种不同数据增强视角的基因组学数据;利用肿瘤细胞系编码器对两种不同数据增强视角的基因组学数据进行特征提取以得到两种肿瘤细胞系表征;利用非线性变换映射头分别对两种肿瘤细胞系表征进行映射变换后,计算两种映射变换结果的互信息,并通过最大化互信息以保证同一个肿瘤细胞系的两种肿瘤细胞系表征的一致性,实现对肿瘤细胞系编码器的预训练;利用训练样本对肿瘤细胞系编码器进行基于原型对比式的自监督学习,包括:利用经过基于对比式的自监督学习预训练的肿瘤细胞系编码器对肿瘤细胞系的基因组学数据进行特征提取,以得到肿瘤细胞系表征;采用K-means聚类算法对肿瘤细胞系表征进行聚类,并以聚类中心初始化最底层的层次化原型表征;再对聚类中心继续K-means聚类算法的聚类,并以新聚类中心初始化上层的层次化原型表征,重复此步骤多次,以初始化相对于最底层的多个上层的层次化原型表征;计算肿瘤细胞系表征与最底层的层次化原型表征之间的相似度或互信息,计算相邻两层的层次化原型表征之间的相似度或互信息,以最大化所有相似度之和或所有互信息之和的期望来优化肿瘤细胞系编码器的参数和层次化原型表征的参数;利用训练样本对包含预训练好的肿瘤细胞系编码器的抗癌药物反应预测模型进行训练,以优化抗癌药物反应预测模型的参数;利用训练好的抗癌药物反应预测模型进行抗癌药物反应预测。

全文数据:

权利要求:

百度查询: 浙江大学温州研究院 基于肿瘤细胞系自监督学习的抗癌药物反应预测方法和装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。