基于遗传算法的ERα拮抗剂的生物活性和ADMET性质优化方法

导航：龙图腾网> 最新专利技术> 基于遗传算法的ERα拮抗剂的生物活性和ADMET性质优化方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：南通大学

摘要：本发明公开了基于遗传算法的ERα拮抗剂的生物活性和ADMET性质优化方法，属于生物制药、机器学习以及智能优化算法技术领域；其技术方案为：包括以下步骤：1、变量筛选：2、预测模型建立：3、分类模型建立；4、利用遗传算法、预测模型和分类模型对数据样本进行迭代寻优，找到ERα拮抗剂的生物活性值达到最优和ADMET性质至少三个性质最好时的对应的自变量的值。本发明的有益效果是：本发明并通过遗传算法实现对生物活性和ADMET性质的优化。

主权项：1.基于遗传算法的ERα拮抗剂的生物活性和ADMET性质优化方法，其特征在于：包含以下步骤：1、变量筛选：1统计各自变量的数据全为零的情况，将所有样本数据全为零的变量进行删除；2随机森林重要度筛选随机森林算法在分类的基础上进行回归分析，通过将样本分类的结果进行一定的运算获得各个特征重要性特征的重要性表示特征对预测结果影响程度，某一特征重要性越大，表明该特征对预测结果的影响越大，重要性越小，表明该特征对预测结果越小，特征权值反映了操作变量的重要程度占比，对每一个操作变量的特征权值，其表示为该特征的平均袋外数据误差与全体特征平均袋外数据误差之和的比值，具体数学表达式如下所示：其中，weightj为特征j的权值，MOETj为特征j的平均袋外数据误差，D为特征总数，此处为预处理后的操作变量总数；3斯皮尔曼Spearman相关系数当样本不符合正态分布时，使用斯皮尔曼相关系数来做相关性分析，斯皮尔曼相关系数描述两个样本的数据是否在一条直线上，是描述两个样本之间是否具有相关性，以及两样本之间相关强度的指标，当相关系数的绝对值越接近于1时，代表两个样本越相关；斯皮尔曼相关系数的定义为：其中，xi，yi代表秩次，ρ表示相关系数，当ρ值得绝对值越接近于1时，表示两个样本之间越线性相关；2、预测模型建立：随机森林算法是一种集成学习方法，随机森林是以K个决策树{hX,θk,k＝1,2,...,K}为基本分类器，不同决策树之间没有关联,进行集成学习后得到的一个组合分类器，基于bootstrap方法，随机森林通常能随机地生成数百甚至上千棵分类树，从这些分类树中，把重复度最高的树选作最终的结果，由回归树θ构成组合模型{hX,θk,k＝1,2,...,K}，采用K棵决策树hX,θk预测值的平均值作为随机森林回归模型最终输出的预测结果；训练随机森林的过程就是训练各个决策树的过程，由于各个决策树的训练是相互独立的，随机森林的训练可以通过并行处理来实现；3、分类模型建立XGBoost以分类回归树为基分类器，采用集成学习中梯度提升的方法进行加法训练，将多个个体分类器组合成一个集成分类器；XGBoost模型的基学习器为分类回归树，对于一棵分类回归树，其复杂度由结构q和叶子节点输出值ω决定，对于一个确定的输入x，存在一个ω与之对应，表征分类回归树对当前输入的预测结果；对于一个有n个样本，m个特征的数据集D＝{x,y}|D|＝n,xi∈Rm,yi∈R，K棵分类回归树预测最终输出为：其中F＝{fx＝ωqx},q:Rm→T,ω∈RT为分类回归树构成的集合；ω为叶子的重；T为叶子节点个数；q为表示每棵树的结构的向量，由样本指向相应的叶子标签；每个函数fk对应一棵独立的树结构qk和叶子权重k；每棵分类回归树的每个叶子节点对应一个连续分数值，i代表第i个结点的分数；qx是对样本x的打分，即模型预测值，对于每个样本，各个分类回归树依据不同分类规则将它分类到叶子节点中，通过累加对应叶子的分数ω来获得最终的预测结果；设训练集的一个少数类的样本数位T，那么SMOTE算法降为这个少数类合成NT个新样本，N是正整数，如果给定的N1那么算法将“认为”少数类的样本数T＝NT，并将强制N＝1；该少数类的一个样本i，其特征向量为xi,i∈{1,2,…T}：1从该少数类的全部T个样本中找到样本xi的k个近邻，记为xinear,near∈{1,2,…k}；2从这k个近邻中随机选择一个样本xinn，再生成一个0到1之间的随机数δ1，从而合成一个新样本xi1；xi1＝xi+δ1·xinn-xi将步骤2重复N次，从而可以合成N个新样本：xinew,new＝1,2,…N；对全部的T个少数类样本进行上述操作，为少数类合成NT个新样本；如果样本的特征维数是2维，每个样本用二维平面上的一个点来表示，SMOTE算法所合成的一个新样本xi1相当于是表示样本xi的点和表示样本xinn的点之间所连线段上的一个点，该算法是基于“插值”来合成新样本；4、利用遗传算法、预测模型和分类模型对数据样本进行迭代寻优，找到ERα拮抗剂的生物活性得最优值：将遗传算法作为优化算法，将机器学习模型作为目标函数，将得到令人满意的结果；遗传算法流程如下：1初始化规模为N的种群，其中染色体每个基因的值采用随机数产生器生成并满足问题定义的范围，当前进化代数Generation＝0；2用评估函数对种群中所有染色体进行评价，分别计算每个染色体的适应值,保存适应值最大的染色体Best；3采用轮盘赌选择运算对种群的染色体进行选择操作，产生规模同样为N的种群；4按照概率Pc从种群中选择染色体进行交叉运算，两两父代染色体交换部分基因，产生两个新的子代染色体，子代染色体取代父代染色体进入新种群，没有进行交叉的染色体直接复制进入新种群；5按照概率Pm对新种群中染色体的基因进行变异操作，发生变异的基因数值发生改变，变异后的染色体取代原有染色体进入新种群，未发生变异的染色体直接进入新群体；6变异后的新种群取代原有种群，重新计算种群中各个染色体的适应值，倘若种群的最大适应值大于Best的适应值，则以该最大适应值对应的染色体替代Best，更新最大适应值大于Best；7当前进化代数Generation加1，如果Generation超过规定的最大进化代数或Best达到规定的误差要求，算法结束，Best可表示问题的一个解；否则返回3。

全文数据：

权利要求：

百度查询：南通大学基于遗传算法的ERα拮抗剂的生物活性和ADMET性质优化方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种自动化振动清洗设备

下一篇：一种电子粉体材料解碎机

相关技术

一种自动化振动清洗设备

一种电子粉体材料解碎机

一种林业遥感无人机及其方法

通信系统及基站

多屏显示方法、装置、设备和介质

一种L-谷氨酸脱氢酶突变体及其应用

多重自动光学复判系统以及多重自动光学复判方法

一种数据的处理方法、装置及设备

黏合剂组合物、电路连接用黏合剂膜及连接结构体的制造方法

加解密管理方法、服务器、系统、介质

一种用于生产灯罩的自动化生产线及生产工艺

服务器拓展模组、服务器、配置方法、设备及介质

生物活性相关技术

杀有害生物活性氨硫脲化合物_巴斯夫欧洲公司_202380022257.4

一种产甲烷菌活性强化的高效生物装置_中山大学_202322814419.8

一种生物能量活性外泌体的制备方法及其应用_华中科技大学_202410617835.5

一种含抗氧化活性成分的锦纶大生物纤维及其制备方法_潍坊瑞银纺织科技有限公司_202411178586.0

负极活性物质、混合负极活性物质材料及负极活性物质的制造方法_信越化学工业株式会社_202380022144.4

具有抗氧化活性的天然活性肽_河南省人民医院_202410915998.1

一种利用电活性微生物储能混凝土电容器及其制备方法_重庆交通大学_202410834843.5

正极活性材料、正极、碱性蓄电池和正极活性材料的制造方法_丰田自动车株式会社_202410697636.X

活性炭生产用输送装置_福建省恒翔炭业有限公司_202420176037.9

活性炭生产用传送架_福建省恒翔炭业有限公司_202323667659.6

拮抗相关技术

胰高血糖素受体拮抗剂的用途_武汉大学_202310309633.X

T2R54的拮抗剂以及它们的组合物及其用途_弗门尼舍公司_201980060635.1

哌嗪吲哚糖皮质激素受体拮抗剂_科赛普特治疗公司_202280091898.0

具有A_2A腺苷受体拮抗作用的小分子化合物_中国人民解放军军事科学院军事医学研究院_202080044228.4

靶向人呼吸道合胞病毒融合糖蛋白的多肽拮抗剂_中科牧维(南京)生物科技有限公司_202310282174.0

特异性拮抗剂抗SIRPG抗体_OSE免疫疗法公司_202280087927.6

胰高血糖素受体拮抗剂的用途_武汉大学_202310273986.9

新型拮抗性抗TNFR2抗体分子_生物发明国际公司_202411004493.6

使用食欲素-2受体拮抗剂治疗抑郁症的方法_詹森药业有限公司_202210483090.9

γ-氨基丁酸受体拮抗剂组合物及其在制备治疗胃癌药物中的应用_威海市立医院_202410689171.3

ADMET相关技术

一种基于融合指纹的分子ADMET性质预测方法及模型_天津贝芸科技有限公司_202410986889.9

一种基于深度学习融合分子图及分子点云预测药物化合物分子的ADMET性质方法_中国药科大学_202410460255.X

一种基于良好分子表征的化合物ADMET性质预测方法_杭州德睿智药科技有限公司_202410167766.2

一种基于多模型集成的ADMET预测的电子设备及其方法_上海数因信科智能科技有限公司_202211248963.4

基于BPMLP-XGBoost的产品活性值和ADMET性质的预测方法及系统_中国工程物理研究院计算机应用研究所_202210337828.0

抗癌候选药物的ADMET性质预测方法及系统_山东师范大学_202210038492.8

基于MMS_ResNet_1d模型的ERα拮抗剂的ADMET性质预测方法_中国科学院合肥物质科学研究院_202111388314.X

基于遗传算法的ERα拮抗剂的生物活性和ADMET性质优化方法_南通大学_202111269625.4

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于遗传算法的ERα拮抗剂的生物活性和ADMET性质优化方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务