买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:南京工业大学
摘要:本发明基于深度学习技术在药物研发中的应用,结合了自适应特征加权、多源域适应技术和对抗学习等方法,提出了一种全新的单细胞药物敏感性预测算法,包括:数据预处理、条件独立自编码器提取特征、自适应加权特征生成,细胞系药物敏感度预测、基于对抗学习的多源域适应,单细胞药物敏感度预测。本发明首次将多源域适应技术应用在单细胞药物敏感性预测领域,并结合基因表达数据和药物反应数据构建模型,通过自适应生成加权特征并使用多源对抗域适应技术在单细胞药物敏感性预测问题上取得了优秀的效果,为肿瘤治疗领域的相关研究提供了新的思路和方法,也为未来的药物研发和治疗提供了有益的借鉴。
主权项:1.一种自适应特征加权多源域适应的单细胞药物敏感性预测算法,其特征在于:包括步骤:1数据筛选与预处理:模型所需的数据为细胞系基因表达数据及药物反应数据,单细胞基因表达数据及药物敏感性标签。2根据药物反应数据生成二值化0或1标签,0表示耐药,1表示对药物敏感,并使用SMOTE采样方法避免样本不均衡带来的性能下降。对基因表达数据进行差异基因分析,筛选出更能影响生物性质的差异基因,并对基因表达数据进行标准化并区分训练集与测试集。3将多个源域与单个目标域数据输入模型,编码器提取到各域数据的特征,为了避免提取的多源域特征信息冗余,设计“条件独立约束”使得潜在空间内的源域特征是相互独立的。4考虑到域迁移中各源域样本对目标域的重要性是不同的,通过自适应权重生成器生成特征维度相似性权重向量,用于自动学习表示不同维度贡献的特征维度水平的显著性系数,以获取各源域与目标域高度相关的特征信息。5采用基于对抗学习的无监督域适应方法,训练域鉴别器使得特征提取器从源域和目标域学习域不变特征,以获取域间的“共享特征”。6预测器根据多源域条件独立特征来预测各细胞系源域的药物反应,并与源域标签比对,计算预测损失,源域和目标域共享同一预测器,使用对抗域适应方法可提取到源域和目标域的域不变特征,以此来预测单细胞目标域的药物反应。所述步骤1中,细胞系基因表达数据和药物反应数据从癌症药物敏感性基因组学GDSC数据库中筛选,单细胞基因表达数据和单细胞药物反应标签从国家生物技术信息中心NCBI的基因表达综合库GEO获得。所述步骤2中,药物反应数据生成二值化0或1标签的方法为:将该药物测试的所有细胞系的IC50值进行排序,然后将其归类为敏感或耐药,二值化阈值设置为针对药物测试的所有细胞系的平均IC50值。敏感细胞系标记为1,而抗性细胞系则标记为0。
全文数据:
权利要求:
百度查询: 南京工业大学 一种自适应特征加权多源域适应的单细胞药物敏感性预测算法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。