买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明一种预训练和几何增强图网络的分子稳定构象生成框架,属于化学信息学与计算机科学领域,包括三维3D图神经网络D‑GeoGNN、预训练任务D‑SSLs与构象生成模型Conf‑GEM。D‑GeoGNN通过输入三张不同的分子图结合分子几何的自监督预训练任务,具备了表征分子3D结构信息的能力。以此为基础,利用变分自编码器与分而治之的思想,构建了分子稳定3D构象快速从头生成的模型。本发明提出了一种全新的分子结构表示学习框架,通过融合“键长‑键角‑二面角”的信息,并结合分子多尺度的自监督预训练任务、变分自编码器与分而治之的思想,实现了分子3D结构信息的完整表征与低能合理3D构象的快速、准确生成。
主权项:1.一种预训练和几何增强图网络的分子稳定构象生成框架,其特征在于,包括三维图神经网络D-GeoGNN、预训练任务D-SSLs与构象生成模型Conf-GEM;三维图神经网络D-GeoGNN由三个同构图神经网络串联组成,分别接受3张图的输入:原子-化学键图G=V,E、化学键-键角图H=E,A、键角-二面角图I=A,D;其中V为原子集合、E为化学键集合、A为键角集合、D为二面角集合;在图G中,原子u∈H被视为图的节点,连接原子u和v的化学键u,v∈E被视为图的边;而图H的节点为化学键u,v∈E,连接化学键u,v和v,w组成的键角u,v,w∈A则视为图H的边;对于图I,键角u,v,w∈A被视为图的节点,键角u,v,w和v,w,x所组成的二面角u,v,w,x∈D被视为边;4个初始特征:使用xu来表示原子u的初始特征,xuv表示化学键u,v的初始特征,xuvw为键角u,v,w的初始特征,xuvwx为二面角的u,v,w,x的初始特征;将3张图与4个初始特征作为三维图神经网络D-GeoGNN的输入;预训练任务D-SSLs:使用一个大规模的无标签数据集对D-GeoGNN进行三维几何水平的预训练,分子的构象系由MMFF94力场计算得到;具体包括预测键长;预测键角;预测二面角;预测两两原子间的距离;并预测键长、键角、二面角、任意两两原子间的距离的损失函数。在对三维图神经网络D-GeoGNN的预训练过程中,总损失为4个几何预训练任务的损失加和,经预训练后的三维图神经网络D-GeoGNN称为D-GEM;对于构象生成模型Conf-GEM中的先验模型、编码器模型与解码器模型都由三个D-GEM串联组成,每个模型的分为治之的策略如下:1第一个GEM接受一个初始分子构象生成构象之后再基于该构象计算得出键长l,即:接着将键长l更新到“原子-化学键图”G,作为下一个模型的输入。需要注意的是,对于先验模型为-1到1的均匀分布的坐标,编码器模型是真实构象,解码器模型是先验模型最终的输出坐标;2第二个GEM接受上一步的生成构象之后再基于该构象计算得出键角θ,即:接着将键角θ更新到“化学键-键角图”H,作为下一个模型的输入;3第三个GEM接受上一步的生成构象之后再基于该构象计算得出二面角ω,即:为该模型最终的输出构象。最后,利用预训练任务D-SSLs中得到的损失函数,计算键长、键角与二面角的损失,并加和得到最终的损失。
全文数据:
权利要求:
百度查询: 中国人民解放军军事科学院防化研究院 一种预训练和几何增强图网络的分子稳定构象生成框架
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。