买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明公开了一种化学反应数据挖掘方法、系统、存储介质及终端,涉及数据挖掘领域。该方法包括:步骤S100:识别反应物分子和或产物分子是否包含R基团,不包含R基团时,结束数据挖掘过程;至少一个反应物分子和至少一个产物分子包含R基团时,执行步骤S200~S600;步骤S200:识别反应物分子和或产物分子中R基团的位置信息;步骤S300:确定R基团的分子结构;步骤S400:当R基团的位置可变时,确定R基团在反应物分子中的连接位置;当R基团的位置固定时,执行步骤S500;步骤S500:将R基团添加到模板反应的反应物分子中,获得候选产物分子对应的反应物分子;步骤S600:重复步骤S300~S500,完成化学反应数据的挖掘。该方法具有自动化程度高、效率高、准确率高的优势。
主权项:1.一种化学反应数据挖掘方法,其特征在于,包括如下步骤:步骤S100:识别模板反应中反应物分子和或产物分子是否包含R基团,模板反应中所有反应物分子和所有产物分子均不包含R基团时,结束数据挖掘过程;模板反应中至少一个反应物分子和或至少一个产物分子包含R基团时,执行步骤S200~S600进行化学反应数据挖掘;步骤S200:识别反应物分子和或产物分子中R基团的位置信息,R基团的位置信息包括位置可变和位置固定;步骤S300:计算候选产物分子与模板产物分子的子结构匹配信息,基于候选产物分子与模板产物分子的差集,确定R基团的分子结构;步骤S400:计算候选产物分子与模板反应中反应物分子的最大公共子结构信息,基于最大公共子结构中各原子在候选产物分子与反应物分子中的映射关系,确定R基团在反应物分子中的连接位置;当R基团的位置固定时,执行步骤S500;步骤S500:将R基团添加到模板反应的反应物分子中,获得候选产物分子对应的反应物分子,基于候选产物分子和生成的反应物分子组装化学反应;步骤S600:重复步骤S300~S500遍历所有的候选产物分子,完成化学反应数据的挖掘;其中,确定R基团的分子结构,包括如下步骤:步骤S310:计算候选产物分子与模板产物分子的子结构匹配信息,以模板产物分子为子结构,确定候选产物分子中与所述子结构匹配的原子编号,以及候选产物分子中未与所述子结构匹配的原子编号;步骤S320:从候选分子中提取出所有未与所述子结构匹配的原子,并将候选产物分子中未与所述子结构匹配的原子编号组成的分子确定为R基团;确定R基团在反应物分子中的连接位置,包括如下步骤:步骤S410:计算候选产物分子与模板反应中反应物分子的最大公共子结构信息,得到最大公共子结构在候选产物分子和反应物分子中匹配的原子编号;步骤S420:将候选产物分子中匹配的原子编号与反应物分子中匹配的原子编号一一对应生成原子映射;步骤S430:根据R基团在候选物分子中的连接位置和原子映射关系,确定R基团在反应物中的连接位置。
全文数据:
权利要求:
百度查询: 碳氢数科(成都)信息技术有限公司 化学反应数据挖掘方法、系统、存储介质及终端
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。