买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:上海交通大学
摘要:本发明涉及一种基于生成式深度学习模型的变构蛋白构象系综预测方法,包括以下步骤:采用四元数表征蛋白质骨架;使用基于分数匹配的生成式建模学习构象数据中隐含的概率分布信息,构建蛋白质结构扩散模型,扩散模型以蛋白质序列作为输入,以采用蛋白质结构表征的变构蛋白动态构象作为输出,模型中的分数匹配网络中采用点不变注意力机制和Transformer;基于DSM损失、骨架原子的位置以及距离矩阵上的损失构建模型的损失函数,对蛋白质结构扩散模型进行训练;获取蛋白质序列,输入训练完成的蛋白质结构扩散模型,得到预测的变构蛋白构象系综。与现有技术相比,本发明实现了在骨架水平对构象进行采样,能够提供更详细的结构特征和更精确的性质估计。
主权项:1.一种基于生成式深度学习模型的变构蛋白构象系综预测方法,其特征在于,通过微调的蛋白质结构扩散模型直接从序列中预测变构蛋白的动态构象集合,所述方法包括以下步骤:蛋白质结构表征:采用由N,Cα,C,O四个原子组成的四元数表征蛋白质骨架,其中,将一个残基形成的蛋白骨架片段看作一个三角刚体,该刚体以Cα为中心;蛋白质结构扩散模型构建:使用基于分数匹配的生成式建模学习构象数据中隐含的概率分布信息,构建蛋白质结构扩散模型,其中,所述蛋白质结构扩散模型以蛋白质序列作为输入,以采用蛋白质结构表征的变构蛋白动态构象作为输出,模型中的分数匹配网络采用点不变注意力机制捕获坐标空间中较近的残基间的相互作用和关系,并在点不变注意力机制后接入Transformer用于学习链整体的特征和长程相互作用;蛋白质结构扩散模型训练:基于DSM损失、骨架原子的位置以及距离矩阵上的损失构建模型的损失函数,对蛋白质结构扩散模型进行训练;变构蛋白构象系综预测:获取蛋白质序列,输入训练完成的蛋白质结构扩散模型,得到预测的变构蛋白构象系综。
全文数据:
权利要求:
百度查询: 上海交通大学 一种基于生成式深度学习模型的变构蛋白构象系综预测方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。