买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:南京邮电大学
摘要:本发明提供一种基于矩阵分解的迭代分块矩阵补全的细胞类型分类方法及系统,通过获取单细胞测序数据,计算基因表达矩阵中每个基因出现的频次并排序;按列进行切分;对切分后的每个分块矩阵使用低秩矩阵分解算法;将分解获得的迭代矩阵和原分块矩阵进行比较,对非零点保持不变,保留生物零点不进行补全,在该零点不是生物零点时进行替换补全,获得除生物零点外补全后的分块基因表达矩阵;拼接合成完整矩阵;构建分类模型,输入的单细胞补全后的完整基因表达矩阵数据后,得到预测的细胞类型;本发明补全后基因表达矩阵的分类性能具有显著提高,有利于对测序数据细胞类型的识别,无需借助太多生物学相关的先验知识,能够获得更高精度的分类结果。
主权项:1.一种基于矩阵分解的迭代分块矩阵补全的细胞类型分类方法,其特征在于:包括以下步骤,S1、获取单细胞测序数据,进行预处理,得到大小为m×n的基因表达矩阵M,计算基因表达矩阵M中每个基因出现的频次,并进行排序,获得排序后的基因表达矩阵P;S2、将排序后的基因表达矩阵P按列进行切分,切分为k个相同大小的分块矩阵V,所得小矩阵的列为其中,n为基因的个数,小矩阵的行为m,且m为细胞的个数;S3、对切分后的每个分块矩阵V使用低秩矩阵分解算法,将其分解为W和H两个矩阵的乘积;S4、更新矩阵W和H,计算W和H的乘积矩阵与分块矩阵V的误差E;S5、在误差E不小于设定阈值时,返回步骤S4;在误差E小于设定阈值时,将W和H的乘积矩阵作为分解获得的迭代矩阵,进入下一步骤S6;S6、将分解获得的迭代矩阵和分块矩阵V进行比较,对分块矩阵V中的非零点保持不变,对零点确认是否为生物零点,保留生物零点不进行补全,在该零点不是生物零点时则为技术零点,对技术零点进行替换补全,获得除生物零点外补全后的分块基因表达矩阵;S7、将步骤S6所得除生物零点外补全后的分块基因表达矩阵,拼接合成完整矩阵,即为补全后的完整基因表达矩阵;使用监督学习分类算法构建分类模型,输入的单细胞补全后的完整基因表达矩阵数据后,得到预测的细胞类型。
全文数据:
权利要求:
百度查询: 南京邮电大学 基于矩阵分解的迭代分块矩阵补全的细胞类型分类方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。