买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:中国石油大学(华东)
摘要:本发明涉及生物信息学领域,特别是涉及基于层次图和几何向量感知器的蛋白质位点预测方法,RAGVP‑PPIS模型构建了一个综合了残基层次和原子层次的蛋白质图,包括:残基图和原子图,模型采用几何向量感知器,构建了基于GVP的图神经网络来学习残基图和原子图上两个尺度的信息来进行预测。模型的主要流程包括:层次图构建、特征学习、信息聚合。最终,聚合后的节点特征被输入到预测层,以生成位点预测结果。实验结果表明,与其他基于蛋白质结构和蛋白质序列的预测方法相比,该模型在准确度、精确度、召回率、F1分数、马修斯相关系数、接收者操作特征曲线下面积以及精确召回曲线下的面积等评估指标上均达到较好的效果。
主权项:1.基于层次图和几何向量感知器的蛋白质位点预测方法,其特征在于,包括以下步骤:S1、从蛋白质序列和蛋白质结构信息中提取蛋白质的节点特征和边特征,包括残基类型、原子坐标、化学键信息;S2、根据提取的节点特征和边特征,构建蛋白质的层次图表示,作为RAGVP-PPIS模型的输入,层次图表示包括原子层次和残基层次的图结构,用于表示蛋白质的不同尺度信息,所述RAGVP-PPIS模型包括输入、特征提取、输出三部分,RAGVP-PPIS模型使用pytorch进行搭建;S3、分别搭建关注原子层次和残基层次的GVP-GNN,以学习原子尺度和残基尺度的特征信息;S4、基于RAGVP-PPIS模型的层次图表示,将蛋白质图的节点特征和边特征输入到对应尺度的GVP-GNN中,进行节点嵌入的聚合更新;S5、RAGVP-PPIS模型通过预测层进行特征降维处理,并输出最终的预测结果;步骤S2中的蛋白质的层次图构建通过对原子层次和残基层次的图结构建模得到;在原子层次图的建模中,每个原子被视为图中的一个节点,节点的特征包括原子的类型、位置坐标以及化学环境,这些信息通过特征向量表示为: ;其中,是从原子提取的特征向量,边的定义基于原子之间的化学键,连接的是具有化学键相连的原子对,边的特征包括距离和键类型,表示为: ;其中,是原子和之间的距离;由此得到的原子层次图包括节点集和边集,其图结构可以表示为: ;在残基层次图的建模过程中,每个残基被视为图中的一个节点,节点的特征包括残基类型、位置以及与相邻残基的接触信息,这些特征通过特征向量表示为: ;其中,是从残基提取的特征向量,边的定义基于残基之间的接触关系,连接的是在空间上相互靠近或具有相互作用的残基对,边的特征表示为: ;由此得到的残基层次图的图结构可以表示为: ;步骤S3中,分别针对S2中构建的原子层次和残基层次的图结构,基于GVP构建图节点特征学习模型,给定一个元组,其中包括标量特征s和向量特征V,向量特征包括位点信息,标量特征是其余非位置信息,计算新特征,其更新公式如下所示: ; ; ; ; ; ; ; ;其中,、、表示线性变换矩阵,表示偏移矩阵,、、、表示向量特征,、、、、、表示标量特征,和指的是非线性函数;同时,为了在图结构上使用GVP,搭建了GVP-GNN,其更新公式如下所示: ; ;其中,gvp表示更新过程,通过LayerNorm进行归一化,加上Dropout来防止过拟合,通过一个加权平均的机制来整合邻居节点的信息,i、j均表示节点,代表第l层节点i和节点j之间的边特征,代表第l层节点i的节点特征,代表第l层节点j的节点特征,代表第l+1层节点i的节点特征,表示节点j传递给节点i的消息;步骤S4中,在蛋白质层次图上进行基于几何向量感知器特征进行特征学习,主要涉及在原子层次图和残基层次图上进行节点嵌入的聚合和更新,以捕捉蛋白质的结构信息并优化预测性能;首先,在原子层次图上进行特征更新,更新的方式如下: ;其中,第层和层的原子层次图节点特征分别表示为和;表示通过更新后的特征;同样的,在残基层次图上的更新方式如下: ;其中,第层和层的原子层次图节点特征分别表示为和;表示通过更新后的特征。
全文数据:
权利要求:
百度查询: 中国石油大学(华东) 基于层次图和几何向量感知器的蛋白质位点预测方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。