Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于深度生成对抗网络模型的单细胞表达谱数据增强方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:西北工业大学

摘要:本发明公开了一种基于深度生成对抗网络模型的单细胞表达谱数据增强方法,首先基于待填充的scRNA‑seq数据构建输入矩阵;然后构建深度生成对抗网络,深度生成对抗网络包括三个生成对抗网络,每个生成对抗网络中包括生成器和判别器,生成器和判别器均是由全连接层、批量归一化层、卷积层和激活层组成;接下来对输入判别器的矩阵进行预处理,并利用数据集对构建的深度生成对抗网络进行分阶段训练;最后利用训练好的深度生成对抗网络对待填充的scRNA‑seq数据进行缺失值推断。本发明大大提高了数据的随机性和多样性,使得推断后的基因表达数据更符合复杂生物过程中细胞和基因之间的依赖关系。

主权项:1.一种基于深度生成对抗网络模型的单细胞表达谱数据增强方法,其特征在于,包括如下步骤:步骤1:基于待填充的scRNA-seq数据构建输入矩阵;步骤1-1:获取scRNA-seq数据集的基因表达矩阵以及细胞类型注释文件,基因表达矩阵的行代表基因,列代表细胞;步骤1-2:对基因表达矩阵进行TPM归一化,并进行对数转换获得归一化后的基因表达矩阵;步骤1-3:将基因表达矩阵中表达量大于0的部分设置为1,表达量等于0的部分设置为0,进而获取基因表达矩阵对应的掩码矩阵;步骤1-4:将细胞类型注释文件进行编码,转换为0,1,2…的形式,得到细胞标签向量;步骤1-5:将归一化后的基因表达矩阵按列进行切片,并将每一列转换为方阵形式;步骤1-6:将掩码矩阵同样按列进行切片,并将每一列转换为方阵形式;转换为方阵形式所用方法为:计算行即基因个数的根号,对结果进行向上取舍得到一个整数值;计算整数值的平方与向行数之间的差值,然后在每一列上添加数量等于差值的行,数量即为上述提到的差值,然后将所添加行的数据全部置为0;步骤2:构建深度生成对抗网络,所述深度生成对抗网络包括三个生成对抗网络,每个生成对抗网络中包括生成器和判别器,所述生成器和判别器均是由全连接层、批量归一化层、卷积层和激活层组成;所述三个生成对抗网络分别是基因表达数据生成对抗网络、掩码矩阵生成对抗网络和填充网络;基因表达数据生成网络的优化目标函数为: 其中Gx表示基因表达数据生成对抗网络的生成器,Dx表示基因表达数据生成对抗网络的判别器,表示所有1-Lipschitz函数的集合,Vx表示基因表达数据生成对抗网络的损失函数;掩码矩阵生成网络的优化目标函数为: 其中Gm表示掩码矩阵生成对抗网络的生成器,Dm表示掩码矩阵生成对抗网络的判别器,Vm表示掩码矩阵生成对抗网络的损失函数,α表示网络训练的超参数;填充网络的优化目标函数为: 其中Gimp表示填充网络的生成器,Dimp表示填充网络的判别器,Vimp表示填充网络的损失函数;步骤3:对输入判别器的矩阵进行预处理,并利用数据集对构建的深度生成对抗网络进行分阶段训练;预处理方式为将基因表达矩阵和掩码矩阵进行结合,方式如下: 其中x为步骤1中处理完的单个细胞的基因表达矩阵,m为其对应的掩码矩阵,⊙表示Hadamard乘积,即两个矩阵按元素进行相乘,为掩码矩阵对应的补码矩阵,τ为网络超参数,τ的取值在0~1之间;步骤3-1:在第一训练阶段,将预处理后的基因表达数据和掩码矩阵输入到网络中,向基因表达数据生成器和掩码矩阵生成器中分别输入噪声向量和数据标签向量,分别生成基因表达数据和掩码矩阵;将生成的掩码矩阵和真实的掩码矩阵输入到掩码矩阵判别器中进行判定,将生成的基因表达数据和掩码矩阵先按步骤3中的数据预处理方式进行结合,然后再将其和预处理后的基因表达数据输入到基因表达数据判别器中进行判别;通过不断训练来优化步骤2中的目标函数;步骤3-2:在第二训练阶段,首先将第一训练阶段得到的基因表达数据生成器参数固定,向该生成器输入随机噪声和数据标签向量生成真实的基因表达数据;向填充网络中输入步骤1中处理好的基因表达矩阵、掩码矩阵、数据标签向量和随机噪声生成填充后的基因表达数据;填充网络生成的数据与基因表达数据生成器生成的数据共同输入到判别器中进行判别,通过不断训练来优化步骤2中的目标函数;步骤4:利用训练好的深度生成对抗网络对待填充的scRNA-seq数据进行缺失值推断。

全文数据:

权利要求:

百度查询: 西北工业大学 基于深度生成对抗网络模型的单细胞表达谱数据增强方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。