首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于域分离网络的lncRNA m6A甲基化位点预测网络模型确定方法及预测方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:东北林业大学

摘要:基于域分离网络的lncRNAm6A甲基化位点预测网络模型确定方法及预测方法,属于生物信息技术领域。本发明分别使用One‑Hot、核苷酸理化性质与频率、位置特异性k‑mer倾向三种编码方法进行序列编码,通过三个同构的网络,分别提取源域mRNA的私有特征、目标域lncRNA的私有特征,以及来自二者的共享特征;基于这些特征进行模型的训练,训练过程中,控制源域和目标域的共享特征的相似性损失获取到高质量共享特征,控制私有特征和共享特征的差异损失将二者分离,控制重构特征与原始特征的损失减少特征丢失。最后提取训练好三个同构的网络中的共享特征提取网络再连接一个分类器,得到用于lncRNAm6A甲基化位点预测的网络模型。

主权项:1.基于域分离网络的lncRNAm6A甲基化位点预测网络模型确定方法,其特征在于,包括以下步骤:S1、获取lncRNAm6A和mRNAm6A的位点信息,根据样本位点信息获取对应的RNA序列片段,使用CD-HIT工具进行去冗余处理,获取到lncRNA和mRNA的序列片段集合作为样本集,样本集包括阳性样本和阴性样本;以lncRNA的阳性样本集和阴性样本集作为目标域的训练数据集,以mRNA的阳性样本集和阴性样本集作为源域的训练数据集;S2、针对lncRNA,使用One-Hot、化学性质与频率信息和位置特异性信息编码方法对序列样本集进行编码,将三种编码方式得到的特征向量对应组合得到lncRNA的原始特征向量,记为Xt;针对mRNA,采用相同的方式得到mRNA的原始特征向量,记为Xs;S3、创建域分离网络模型,包含目标域lncRNA的私有特征提取网络源域mRNA的私有特征提取网络目标域lncRNA和源域mRNA的共享特征提取网络Ec;目标域lncRNA的私有特征提取网络源域mRNA的私有特征提取网络目标域lncRNA和源域mRNA的共享特征提取网络Ec为三个同构的特征提取网络;目标域的私有特征提取网络用于提取lncRNA的私有特征源域的私有特征提取网络用于提取mRNA的私有特征共享特征提取网络用于提取lncRNA和mRNA二者的共享特征和S4、将经过目标域lncRNA的私有特征提取网络提取到的lncRNA的私有特征向量和共享特征提取网络Ec提取到的lncRNA的共享特征向量组合在一起,经过解码器还原得到还原向量针对mRNA的解码采用与lncRNA解码进行相同的处理得到mRNA的还原向量S5、训练域分离网络模型,每次循环使用lncRNA和mRNA的数据交替对域分离网络模型进行训练;针对lncRNA数据,计算来自lncRNA的共享特征向量与私有特征向量的损失域分类的相似性损失lncRNA被还原特征向量与原始特征向量Xt的损失lncRNA的分类损失根据lncRNA的总体损失Lt进行优化; 其中,α,β,γ是控制损失项相互作用的权重;针对源域mRNA数据,采用与目标域lncRNA损失相同的方式计算总体损失Ls进行优化;域分离网络模型训练完成后,提取训练好的域分离网络模型中的共享特征提取网络Ec再连接一个分类器,得到用于lncRNAm6A甲基化位点预测的网络模型。

全文数据:

权利要求:

百度查询: 东北林业大学 基于域分离网络的lncRNA m6A甲基化位点预测网络模型确定方法及预测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。