首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于深度特征融合的疾病相关circRNA预测系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:东北林业大学

摘要:基于深度特征融合的疾病相关circRNA预测系统,本发明涉及疾病相关circRNA预测系统。本发明的目的是为了解决现有基于机器学习的方法只是将circRNA和disease的特征分别处理后进行简单的拼接,只关注网络中相邻结点的特征和本身的特征,没有将disease的特征信息与circRNA的特征信息进行整合,导致disease的特征与circRNA特征中的有效信息没有得到充分利用,对disease与circRNA的关联性预测准确率低的问题。系统包括:circRNA‑disease之间的关联关系获取模块、矩阵获取模块、circRNA整合相似性矩阵获取模块、disease整合相似性矩阵获取模块、局部特征提取模块、circRNA的全局特征提取模块、disease的全局特征提取模块、disease特征获取模块、circRNA特征获取模块、disease与circRNA的关联预测模块、待测模块。本发明用于生物信息领域。

主权项:1.基于深度特征融合的疾病相关circRNA预测系统,其特征在于:所述系统包括:circRNA-disease之间的关联关系获取模块、矩阵获取模块、circRNA整合相似性矩阵获取模块、disease整合相似性矩阵获取模块、局部特征提取模块、circRNA的全局特征提取模块、disease的全局特征提取模块、disease特征获取模块、circRNA特征获取模块、disease与circRNA的关联预测模块、待测模块;所述circRNA为环状RNA;disease为疾病;circRNA-disease之间的关联关系获取模块用于收集circRNA-disease关联数据,对关联数据进行预处理,得到circRNA-disease之间的关联关系,再获取疾病之间的关联关系;矩阵获取模块用于由circRNA-disease之间的关联关系和疾病之间的关联关系计算circRNA的多种相似性矩阵,disease的多种相似性矩阵,circRNA协同矩阵,disease协同矩阵;circRNA整合相似性矩阵获取模块用于对circRNA的多种相似性矩阵进行整合,获得circRNA整合相似性矩阵;disease整合相似性矩阵获取模块用于对disease的多种相似性矩阵进行整合,获得disease整合相似性矩阵;局部特征提取模块用于使用CNN对circRNA和disease的整合相似性矩阵进行处理,提取circRNA和disease的局部特征,获得circRNA和disease的局部特征矩阵;所述CNN为卷积神经网络;circRNA的全局特征提取模块用于将circRNA整合相似性矩阵与circRNA协同矩阵输入GCN,经过两层GCN特征提取得到circRNA的全局特征,获得circRNA的全局特征矩阵;disease的全局特征提取模块用于将disease整合相似性矩阵与disease协同矩阵输入GCN,经过两层GCN对特征的提取得到disease的全局特征,获得disease的全局特征矩阵;所述GCN为图神经网络;disease特征获取模块用于将disease局部特征和circRNA全局特征进行融合,获得最终的disease特征矩阵;circRNA特征获取模块用于将circRNA局部特征和disease全局特征进行融合,获得最终的circRNA特征矩阵;disease与circRNA的关联预测模块用于将获得的最终的disease特征矩阵和最终的circRNA特征矩阵输入随机森林进行disease与circRNA的关联预测,直至收敛,获得训练好的disease与circRNA的关联预测模块;待测模块用于将待测disease与circRNA输入训练好的disease与circRNA的关联预测模块进行关联评分预测;所述矩阵获取模块用于由circRNA-disease之间的关联关系计算circRNA的多种相似性矩阵,disease的多种相似性矩阵,circRNA协同矩阵,disease协同矩阵;具体过程为:使用circRNA-disease之间的关联关系和疾病之间的关联关系计算disease语义相似性,disease高斯相似性,disease协同矩阵,circRNA功能相似性,circRNA高斯相似性,circRNA协同矩阵;A、disease语义相似性计算公式如下: 其中,dm为diseasem,dn为diseasen,DSdm,dn为diseasem和diseasen的语义相似性;是包含diseasem的有向无环图中,diseasem所有的祖先结点与diseasem本身所组成的集合;是包含diseasen的有向无环图中,diseasen所有的祖先结点与diseasen本身所组成的集合;h是diseaseh;x是或中的疾病; 是diseaseh对diseasen的语义贡献值,是diseaseh对diseasem的语义贡献值,可以通过如下公式计算: 其中,θ为语义贡献因子,设置为0.5;*为乘号,为diseaseh′对diseasem的语义贡献值,h′为diseaseh′,childrenofh为diseaseh的子女;B、disease高斯相似性计算公式如下:: 其中,DGdm,dn为diseasem和diseasen的高斯相似性;Αdm为circRNA-disease关联矩阵的第m列,Αdn为circRNA-disease关联矩阵的第n列,Nd为circRNA-disease关联矩阵的列数,i表示关联矩阵第i列,Αdi为circRNA-disease关联矩阵的第i列;C、circRNA功能相似性计算流程如下:首先计算DSSdq,Dn,DSSdq,Dn表示diseaseq与Dn中每个疾病的语义相似性的最大值,通过如下公式得到; 其中,DSdq,du表示diseaseq和diseaseu的语义相似性,dq为diseaseq,du为diseaseu,Dn表示与circRNAn相关的disease集合;然后使用disease语义相似性和circRNA-disease关联矩阵进行circRNA功能相似性的计算,circRNA功能相似性计算公式如下: 其中,CFcm,cn表示circRNAm与circRNAn的功能相似性,cm表示circRNAm,cn表示circRNAn,DSSdp,Dm表示diseasep与Dm中每个疾病的语义相似性的最大值,Dm表示与circRNAm相关的disease集合;D、circRNA高斯相似性计算公式如下: 其中,CGcm,cn表示circRNAm与circRNAn的高斯相似性;Αcn表示circRNA-disease关联矩阵的第n行,Αcm为circRNA-disease关联矩阵的第m行,Nc为circRNA-disease关联矩阵的行数,i表示circRNA-disease关联矩阵第i行,Αci为circRNA-disease关联矩阵的第i行;E、circRNA协同矩阵和Disease协同矩阵具体为:circRNA协同矩阵第m行第n列上的值为在所有disease中,某一个disease与circRNAm有关时,也与circRNAn有关的概率;Disease协同矩阵第m行第n列上的值为在所有circRNA中,某一circRNA与diseasem有关时,也与diseasen有关的概率;所述circRNA整合相似性矩阵获取模块用于对circRNA的多种相似性矩阵进行整合,获得circRNA整合相似性矩阵;具体过程为:将circRNA功能相似性和circRNA高斯相似性进行整合,获得circRNA整合相似性矩阵,表达式如下: 其中,Csimcm,cn为circRNAm与circRNAn整合的相似性的值;所述disease整合相似性矩阵获取模块用于对disease的多种相似性矩阵进行整合,获得disease整合相似性矩阵;具体过程为:将disease语义相似性和disease高斯相似性进行整合,获得disease整合相似性矩阵表达式如下: 其中,Dsimdm,dn为diseasem与diseasen整合的相似性的值;所述局部特征提取模块用于使用CNN对circRNA和disease的整合相似性矩阵进行处理,提取circRNA和disease的局部特征,获得circRNA和disease的局部特征矩阵;所述CNN为卷积神经网络;具体过程为:CNN的卷积层使用一个卷积核对disease和circRNA的特征进行过滤,以提取circRNA和disease的特征,然后经过池化层得到circRNA与disease的局部特征;所述circRNA的全局特征提取模块用于将circRNA整合相似性矩阵与circRNA协同矩阵输入GCN,经过两层GCN特征提取得到circRNA的全局特征,获得circRNA的全局特征矩阵;具体过程为:每一层GCN的输出由如下公式表示: Hnew=GCNW,H其中,W为circRNA的协同矩阵,H为circRNA相似性矩阵,Relu为激活函数,Hnew为经过GCN处理得到的新的circRNA特征矩阵,为中间变量,I为单位矩阵,L是一个度矩阵,为的第i行第j列,Q为一个可训练的矩阵;所述disease特征获取模块用于将disease局部特征和circRNA全局特征进行融合,获得最终的disease特征矩阵;具体过程为:将disease局部特征矩阵和circRNA全局特征矩阵进行点乘获得最终的disease特征矩阵;所述circRNA特征获取模块用于将circRNA局部特征和disease全局特征进行融合,获得最终的circRNA特征表示;具体过程为:将circRNA局部特征矩阵和disease全局特征矩阵进行点乘获得最终的circRNA特征矩阵;所述disease与circRNA的关联预测模块用于将获得的最终的disease特征矩阵和最终的circRNA特征矩阵输入随机森林进行disease与circRNA的关联预测,直至收敛,获得训练好的disease与circRNA的关联预测模块;具体过程为:最终的circRNA特征矩阵和disease整合相似性矩阵进行拼接获得circRNA-disease对的特征矩阵1;最终的disease特征矩阵和circRNA整合的相似性矩阵进行拼接获得circRNA-disease对的特征矩阵2;所述最终的circRNA特征矩阵和disease整合相似性矩阵进行拼接获得circRNA-disease对的特征矩阵1;具体过程为:最终的circRNA特征矩阵为行,disease整合相似性矩阵为行;将circRNA特征矩阵的第一行数据分别与disease整合相似性矩阵的行数据进行拼接,获得行数据,作为获得circRNA-disease对的特征矩阵1的第一行至第行;将circRNA特征矩阵的第二行数据分别与disease整合相似性矩阵的行数据进行拼接,获得行数据,作为获得circRNA-disease对的特征矩阵1的第行至第行;直至将circRNA特征矩阵的第行数据分别与disease整合相似性矩阵的行数据进行拼接,获得行数据,作为获得circRNA-disease对的特征矩阵1的第行至第行;最终的circRNA特征矩阵与disease整合相似性矩阵进行拼接共获得行数据;所述最终的disease特征矩阵和circRNA整合的相似性矩阵进行拼接获得circRNA-disease对的特征矩阵2;具体过程为:最终的circRNA特征矩阵为行,disease整合相似性矩阵为行;将circRNA整合的相似性矩阵的第一行数据分别与disease特征矩阵的行数据进行拼接,获得行数据,作为获得circRNA-disease对的特征矩阵2的第一行至第行;将circRNA整合的相似性矩阵的第二行数据分别与disease特征矩阵的行数据进行拼接,获得行数据,作为获得circRNA-disease对的特征矩阵2的第行至第行;直至将circRNA整合的相似性矩阵的第行数据分别与disease特征矩阵的行数据进行拼接,获得行数据,作为获得circRNA-disease对的特征矩阵2的第行至第行;最终的circRNA特征矩阵与disease整合相似性矩阵进行拼接共获得行数据;用circRNA-disease对的特征矩阵1训练随机森林模型1,获得训练好的随机森林模型1;用circRNA-disease对的特征矩阵2训练随机森林模型2,获得训练好的随机森林模型2;将circRNA-disease对的特征矩阵1输入训练好的随机森林模型1输出的关联评分1;将circRNA-disease对的特征矩阵2输入训练好的随机森林模型2输出的关联评分2;将随机森林模型1输出的关联评分1和随机森林模型2输出的关联评分2相加除以2,得到circRNA-disease对的关联评分。

全文数据:

权利要求:

百度查询: 东北林业大学 基于深度特征融合的疾病相关circRNA预测系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。