买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:南京工业大学
摘要:在癌症治疗中,预测药物响应是个重要且具有挑战性的任务。由于细胞系的数据多,而单细胞或病人的数据相对匮乏,使得传统借助细胞系或病人数据来做域迁移或域适应之类的方法存在一定的局限性,特别当缺少某个癌种的单细胞或病人数据时,那我们就完全无法将细胞系上学习到的知识迁移到待分类的目标数据上,为填补这一方面的空缺,我们提出一种基于对抗学习方法的域泛化模型,旨在通过消除不同域间的分布差异来提高模型的通用性。我们的模型通过梯度反转将来自不同域的数据进行对抗学习,使得这些数据在嵌入空间中与药物响应无关的那一部分信息被模糊。为实现这一目标,我们借助潜在独立因子编码,让每一个维度的特征都与某一个特定周期的正弦波做线性组合,以确保分类任务与对抗学习间的任务是相互独立的。在实验部分,我们使用了公共数据源的数据,分别进行了细胞系、单细胞和肿瘤病人的药物响应预测实验。结果表明,我们提出的域泛化理论是可靠的。
主权项:1.一种基于对抗域泛化的药物敏感性预测算法,其特征在于:包括步骤:1数据筛选与预处理:模型所需的数据为细胞系基因表达数据及药物反应数据,单细胞与癌症病人基因表达数据及药物敏感性标签。2根据药物反应数据生成二值化0或1标签,0表示耐药,1表示对药物敏感。对基因表达数据进行差异基因分析,筛选出更能影响生物性质的差异基因。同时按照不同的癌症将训练集数据按照独热编码划分成不同的源域。3将多个源域与单个目标域数据输入模型,编码器提取到各源域数据的特征,并在嵌入空间中引入正交三角函数系,设计“潜在独立因子编码”使得嵌入空间内的特征是相互独立的。4由于不同癌种间的分布差异,我们合理推测对转录谱提取特征至少包含两部分信息,其一是与药物敏感有关的特征,另一部分是与癌症有关的特征,与癌种相关的这一部分特征不仅不能提供药物响应的信息,还会使我们从一个域学习到的分类模型无法适用于另一个域,如果我们有足够多的域进行对抗学习域混淆,使得模型无法分辨需要分类的这一个域是来自哪种癌症,那么我们便可以把单细胞或病人的肿瘤切片当作一个广义的细胞系源域来骗过模型,使得模型只抓取与药物响应相关的特征,从而进行正确分类。5我们可以将细胞系的转录谱映射到740维的线性子空间中,不同源域的子空间存在同构映射,因此我们可以用特征向量的模长作为区分药物敏感信息的一种指标,例如将包含敏感特征的细胞系聚拢在空间中某一点的领域内,将包含耐药特征的细胞系分散在以这个点为球心的740维的超球面上,在此我们引入三元损失作为区分正负样本特征向量模长的工具,我们选定某一正样本作为锚点,在拉近正样本与锚点的同时放大负样本与锚点的欧氏距离。所述步骤1中,细胞系基因表达数据和药物反应数据均从公共数据源获得。所述步骤2中,药物反应数据生成二值化0或1标签的方法为:耐药性标签是根据同一种药物作用下细胞系的IC50值来划分,在这里我们取置信水平为α=0.05的置信上限作为划分药物响应的阈值
全文数据:
权利要求:
百度查询: 南京工业大学 一种基于对抗域泛化的药物敏感性预测算法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。