买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:深圳智药信息科技有限公司
摘要:本发明公开了一种自动药物设计方法、系统、计算设备及计算机可读存储介质。所述方法包括:将目标先导化合物分解为具有可合成模块的片段,依次将所述片段输入已经训练的药物设计机器学习模型进行采样;将所述药物设计机器学习模型输出的新片段重新组装,得到新的先导化合物。本发明的自动药物设计,在分子生成有效性、独特性方面性能有大幅提升,可以生成新颖性高、可合成性强、成药性强的分子;可以轻松地在高分子量区域生成分子;只需用特定数据集训练一次,即可重复用于不同的靶点先导化合物生成场景;可以很容易实现固定化合物局部结构,对其余部分进行优化。
主权项:1.一种自动药物设计方法,其特征在于,包括:将目标先导化合物分解为具有可合成模块的片段,依次将所述片段输入已经训练的药物设计机器学习模型进行采样;将所述药物设计机器学习模型输出的新片段重新组装,得到新的先导化合物;在训练所述药物设计机器学习模型时,通过BRICS算法获取训练数据集,并基于所述训练数据集训练L2F2L框架VAE模型,得到所述药物设计机器学习模型;其中,所述训练数据集通过如下方式获得:以预定规则对CHEMBL25数据集中的活性化合物进行过滤,得到初始数据集;将初始数据集中的每一个初始化合物分解为具有可合成模块的片段并去重,得到多个非冗余片段;使用随机生成SMILES方法,将所述非冗余片段扩增预定倍数,以扩增后得到的多条SMILES字符串作为所述训练数据集;所述预定规则包括:活性化合物作用靶点属于人属蛋白家族GPCRA,Hydrolase,Kinase,Ligand-gatedIonChannel,Oxidoreductase,Protease,Transferase,Transporter,Voltage-gatedIonChannel中的一种;活性测试类型为SINGLEPROTEIN;去除含有碎片的化合物;去除分子量大于500的化合物;以及去除PCHEMBL6的低活性化合物。
全文数据:
权利要求:
百度查询: 深圳智药信息科技有限公司 自动药物设计方法、系统、计算设备及计算机可读存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。