买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:山东大学
摘要:本发明公开了基于分层自注意力机制的差异表达基因预测系统,包括:获取模块,获取待测细胞对对应基因的表观遗传学数据;根据表观遗传学数据,构建不同表观遗传因素的输入矩阵;编码模块,将每种表观遗传因素的输入矩阵,输入到第一自注意力机制层对应的自注意力机制模块中,得到每种表观遗传因素的编码向量;特征提取模块,将每种表观因素的编码向量,输入到第二自注意力机制层的自注意力机制模块中,得到最终的特征嵌入向量;预测模块,将最终的特征嵌入向量输入到训练后的分类器中,得到差异表达基因预测结果。利用表观遗传学数据自动构建特征,同时识别重要的特征位点和表观遗传因素来进行可解释的基因差异表达预测。
主权项:1.基于分层自注意力机制的差异表达基因预测系统,其特征是,包括:获取模块,其被配置为:获取待测细胞对对应基因的表观遗传学数据;根据表观遗传学数据,构建不同表观遗传因素的输入矩阵;编码模块,其被配置为:将每种表观遗传因素的输入矩阵,输入到第一自注意力机制层对应的自注意力机制模块中,得到每种表观遗传因素的编码向量;特征提取模块,其被配置为:将每种表观因素的编码向量,输入到第二自注意力机制层的自注意力机制模块中,得到最终的特征嵌入向量;预测模块,其被配置为:将最终的特征嵌入向量输入到训练后的分类器中,得到差异表达基因预测结果;所述将每种表观遗传因素的输入矩阵,输入到第一自注意力机制层对应的自注意力机制模块中,得到每种表观遗传因素的编码向量;具体包括:对DNA甲基化输入矩阵,通过线性变换的形式得到第一查询Query矩阵、第一键Key矩阵和第一值Value矩阵;对DNA甲基化输入矩阵的第i个位点,将第i个位点对应的第一Query矩阵的Query向量,与所有非第i个位点对应的第一Key矩阵中的Key向量进行相似度计算,得到所有的相似度值;其中,i为正整数;i表示位点的编号;将得到的所有的相似度值,通过softmax函数进行处理,得到第i个位点的注意力权重;进而得到所有位点的注意力权重矩阵;利用所有位点的注意力权重矩阵,对所有位点的Value矩阵进行加权求和,得到编码矩阵;对编码矩阵,进行线性变换降维处理,得到DNA甲基化的编码向量;所述将每种表观因素的编码向量,输入到第二自注意力机制层的自注意力机制模块中,得到最终的特征嵌入向量;具体包括:将获得的DNA甲基化的编码向量与各种组蛋白修饰编码向量拼接,获得第二自注意力机制层的自注意力机制模块的输入矩阵,通过线性变换的形式得到第二查询Query矩阵、第二键Key矩阵和第二值Value矩阵;对每种表观遗传因素,将其第二Query矩阵中对应的Query向量与所有第二Key矩阵中的Key向量通过缩放点积的方式计算相似度,采用softmax函数对相似度进行处理得到当前因素注意力权重向量;进而得到所有因素的注意力权重向量,构建表观遗传因素注意力权重矩阵;根据表观遗传因素注意力权重矩阵,对第二Value矩阵进行加权求和,得到最终的特征嵌入向量。
全文数据:
权利要求:
百度查询: 山东大学 基于分层自注意力机制的差异表达基因预测系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。