买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:华东师范大学
摘要:本发明涉及一种基于图卷积神经网络预测小分子化合物解离常数的方法,该方法不同于传统的基于分子指纹的预测方法,通过图卷积神经网络自动学习与解离常数有关的化学模式构建预测模型。ChEMBL数据库中160万种化合物的解离常数用于训练模型。此外,为了快速确定每个化合物中的解离中心,本发明基于ChEMBL数据库构建了一个含144个SMARTS模板的子结构数据库。预测新的化合物时,首先使用SMARTS模板库匹配化合物中的解离中心,然后依次预测每个解离中心的解离常数。利用本发明,可以快速准确地预测化合物的解离常数,提高药物设计和虚拟筛选的效率。
主权项:1.一种基于图卷积神经网络预测小分子化合物解离常数的方法,其特征在于,该方法包括以下具体步骤:步骤1:从ChEMBL数据库中提取所有化合物的结构以及每个化合物的解离常数,除去其中含盐、含溶剂和非中性态的化合物;将化合物中的解离中心分为酸性和碱性;步骤2:使用Epik程序计算步骤1中提取的所有化合物的解离常数;步骤3:将Epik程序的计算结果与ChEMBL数据库中提取的解离常数进行匹配,确定ChEMBL中解离常数所属的解离中心;步骤4:Epik程序的计算结果和ChEMBL中记录的解离常数相差大于2,则丢弃这个样本;步骤5:统计每种类型解离中心的解离常数的均值Mean和标准差SD,当ChEMBL中提取的解离常数不符合所属类型的统计结果,即不满足Mean±SD,则丢弃该样本,构成数据集;步骤6:基于步骤5中清洗得到的数据集,构建解离中心的SMARTS模板库,所述模板库包括酸性解离中心和碱性解离中心;步骤7:基于步骤5中清洗得到的数据集,计算每个解离中心的分子图,并记录对应的解离常数,构建预测模型的训练集;步骤8:基于步骤7中得到的训练集,使用图卷积神经网络训练酸性解离中心的预测模型和碱性解离中心的预测模型;步骤9:使用决定系数、平均相对误差和均方根误差三种指标评估模型性能,利用所述指标从步骤8保存的模型中筛选性能最佳的模型作为最终预测模型;步骤10:预测化合物的解离常数,首先使用步骤6中构建的解离中心SMARTS模板库匹配化合物中所有的酸性解离中心和碱性解离中心,然后使用步骤9中得到的预测模型分别预测酸性解离中心和碱性解离中心;步骤11:以图表的形式可视化步骤10中得到的预测结果。
全文数据:
权利要求:
百度查询: 华东师范大学 一种基于图卷积神经网络预测小分子化合物解离常数的方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。