首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于机器学习的化合物胎盘膜透过性的预测方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:浙江大学

摘要:本发明公开了一种基于机器学习的化合物胎盘膜透过性的预测方法,包括以下步骤:1建立化合物胎盘膜透过性判断标准;2采集化合物建立BPBData数据集,得到样本数据和样本标签,并对样本数据进行预处理;3基于机器学习算法构建预测模型,利用预处理后的样本数据对预测模型在样本标签的监督下进行训练,以优化预测模型参数;4预测待测化合物的胎盘膜透过性。本发明方法利用双参数FM化合物体内胎儿‑母体血液浓度比和CI清除指数建立化合物胎盘膜透过性判断标准;再构建化合物分子结构特征与其胎盘膜透过性的预测模型,实现了化合物胎盘膜透过性的高通量、低时间、低成本、高精度的预测。

主权项:1.一种基于机器学习的化合物胎盘膜透过性的预测方法,其特征在于,包括以下步骤:1建立化合物胎盘膜透过性判断标准;2采集化合物建立BPBData数据集,清洗数据集后根据步骤1建立的标准评价数据集中的样本是否具有胎盘膜透过性,将评价结果作为样本标签,导出样本的SMILES表达式后计算分子指纹,再提取样本的分子描述符作为样本数据,对样本数据进行预处理;3基于机器学习算法构建预测模型,利用预处理后的样本数据对预测模型在样本标签的监督下进行训练,以优化预测模型参数;所述的机器学习算法为神经网络算法;4导出待测化合物的SMILES表达式后计算分子指纹,再提取分子描述符作为待测数据输入至参数优化的预测模型中,预测待测化合物的胎盘膜透过性;步骤1中,采用双参数FM和CI判定化合物胎盘膜透过性,FM为化合物体内胎儿-母体血液浓度比,CI为清除指数;FM=胎儿血液中化合物浓度母体血液中化合物浓度CI=化合物胎盘渗透率安替比林胎盘渗透率其中,参数FM的优先级大于参数CI;当参数FM≤0.15,表示该化合物不具有胎盘膜透过性,当参数FM≥0.3,表示该化合物具有胎盘膜透过性;如果参数FM不可获取:当参数CI0.80,表示该化合物具有胎盘膜透过性;当参数CI≤0.80,表示该化合物不具有胎盘膜透过性;清洗数据集的步骤为:对BPBData数据集填补空白值、去除无机物、盐类与中性分子、去除零值和零方差值并去除高相关性值;对于拥有超过1个参数FM的样本:如果参数FM有2个,则取加权平均值;如果参数FM多于2个,则选取出现频率最高的参数FM;对于拥有超过1个参数CI的样本:如果参数CI有2个,则取加权平均值;如果参数CI多于2个,则选取出现频率最高的参数CI;所述的预处理方式包括标准化和归一化,标准化是依照特征矩阵的列处理数据,将样本的特征值转换到同一量纲下;归一化是依照特征矩阵的行处理数据,将数据映射到指定的范围。

全文数据:

权利要求:

百度查询: 浙江大学 一种基于机器学习的化合物胎盘膜透过性的预测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。