一种基于R-CNN-GA的抗乳腺癌候选药物分类预测方法

导航：龙图腾网> 最新专利技术> 一种基于R-CNN-GA的抗乳腺癌候选药物分类预测方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：内蒙古工业大学

摘要：一种基于R‑CNN‑GA的抗乳腺癌候选药物分类预测方法，包括：基于RFE和RF的主特征提取，提取原始数据中对生物活性影响重要性最强的主要特征；基于CNN_FC的ERα生物活性的定量预测方法，通过选取主要的特征变量来预测化合物对应的IC50和PIC50值；基于CNN_FC的多标签分类预测方法，对数据中化合物的Caco‑2、CYP3A4、hERG、HOB、MN特性进行分类预测；以及基于遗传算法的多目标优化模型，优化选取有益的特征变量及其最优取值范围。本发明高精度地预测了IC50和PIC50的值，并对原始特征进行指标分类，并结合遗传算法进行优化，进一步选取抗乳腺癌候选药物有益的特征及其最优取值范围。

主权项：1.一种基于R-CNN-GA的抗乳腺癌候选药物分类预测方法，其特征在于，包括如下步骤：步骤1，将原始抗乳腺癌候选药物数据集采用递归特征消除和随机森林相结合的方式进行主要特征提取，得到对生物活性影响重要性最强的20个主要特征，并根据数据特点，采用最大最小归一化方法对选取的20个主要特征进行数据归一化操作；步骤2，将步骤1中归一化后的数据作为模型输入，输入至ERα生物活性的定量预测模型中，获得每个作用于所述ERα生物活性的化合物的IC50值和PIC50值，其中所述定量预测模型采用CNN_FC模型架构；步骤3，根据原始抗乳腺癌候选药物数据集中的所有特征，采用基于CNN_FC的多标签分类预测方法对数据中化合物的Caco-2、CYP3A4、hERG、HOB、MN特性进行分类预测，获得所有作用于所述ERα生物活性的化合物的分类结果；步骤4，计算步骤1中获得的20个主要特征与单一随机森林降维得到的20个特征的交集，并结合步骤3获得的分类结果，线性分析交集中特征对ADMET和PIC50值的影响正负相关性，取得对PIC50值影响正相关的特征，采用遗传算法计算优化后的取值范围，并结合lingo软件对ADMET和PIC50值之和进行线性规划，获得对应特征的取值，以此对候选药物选取提供数据支撑；所述步骤1中，利用递归特征消除和随机森林相结合的方式进行主要特征提取的方法如下：步骤1.1，将原始数据中需要筛选的729个特征输入至随机森林分类器中，计算每个特征的重要性，利用交叉验证方法得到初试特征的分类精度，移除重要性最低的特征；步骤1.2，递归执行步骤1.1，直到剩余特征个数为1，以此获得每个特征重要性排序，取前最重要的20个主要特征，通过计算其相关性及原始特征变量列别划分，验证特征提取有效性；所述步骤2中，所述ERα生物活性的定量预测模型是在CNN_FC模型架构基础上，添加Dropout层和BatchNormalization，并采用Relu函数作为激活函数，同时结合Adam优化算法提高模型整体的运算速度，获得IC50和PIC50预测值；所述步骤3包括：步骤3.1，将包含729个特征的原始抗乳腺癌候选药物数据使用最大最小归一化方法进行数据归一化操作；步骤3.2，归一化后的数据作为输入数据，输入至CNN_FC模型中，该模型由一层CNN、四层FullConnectedLayer层、一个Dropout层和BatchNormalization层构成，并采用Relu函数作为激活函数，加快模型的收敛速度，并在最后一层采用sigmoid激活函数将数据映射在0,1之间；步骤3.3，使用基于马修斯相关系数的自适应阈值判断预测标签具体的分类结果，马修斯相关系数MCC计算公式如下：其中：TP是真阳性数量；TN是真阴性数量；FP是假阳性数量；FN是假阴性数量；所述步骤4中，采用基于遗传算法的优化方法如下：步骤4.1，采用单一随机森林算法求解对ADMET影响最好的前20个特征，即分子描述符，并选择与步骤1中求得的20个主要特征相同的m个特征，m≤20；步骤4.2，将PIC50作为因变量，计算m个特征与PIC50间的皮尔森系数，保留皮尔森系数为正相关的特征变量，皮尔森系数计算公式如下所示：其中：x和y为两个特征变量；为特征变量x的均值；为特征变量y的均值，r值大于0时，表示该两个特征变量间具有正相关性；r小于0时，表明该两个特征变量间具有负相关性；步骤4.3，使用SPSS软件对步骤4.2中保留的正相关特征变量进行回归分析，得到他们之间的函数关系，函数关系如下式所示：其中：y1、y2分别表示PIC50的值与ADMET正相关性的值；x1、x2、x3分别表示MDEC-23、MLFER_A、minHBa的值；步骤4.4，使用遗传算法，将步骤4.3中的两个函数分别作为目标函数进行迭代，获得两个目标函数的取值范围；步骤4.5，使用lingo软件对步骤4.2中的正相关性特征做线性规划，获得正相关性特征变量的最优取值。

全文数据：

权利要求：

百度查询：内蒙古工业大学一种基于R-CNN-GA的抗乳腺癌候选药物分类预测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种基于InSAR数据和多诱发因子的形变智能预测方法

下一篇：面向机器学习空间预测模型的样点布设方法、设备及介质

相关技术

一种基于InSAR数据和多诱发因子的形变智能预测方法

面向机器学习空间预测模型的样点布设方法、设备及介质

VEGF结合分子及其医药用途

一种用于纸质食品接触材料中3-MCPD选择性检测的分子印迹聚合物基石英晶体微天平纳米传感器及其制备与应用

一种培养皿装配及码垛一体化设备

一种用于铸造振动输送设备的隔振设计方法

基于数字孪生的数据智能可视化方法

一种聚氨酯内胎成型的脱模装置

一种PCB制程清洗用高浓度臭氧水发生装置

用于车辆的制动设备的多活塞断开接合系统、用于车辆的具有多活塞断开接合系统的制动设备以及用于车辆的具有该制动设备的传动装置

内窥镜光源主机及其摄像系统

像素排布结构、显示面板及显示装置

乳腺癌相关技术

一种乳腺癌术后引流器_蚌埠医学院第一附属医院_202323353210.2

一种保护乳腺癌放疗患者健侧乳腺及限制呼吸幅度的装置_高翔_202410909872.3

一种乳腺癌基因甲基化标记物及其应用_湖南宏雅基因技术有限公司_202410842234.4

一种治疗乳腺癌术后焦虑抑郁的中药香囊及其制备方法_南通市中医院_202410878204.9

一种基于R-CNN-GA的抗乳腺癌候选药物分类预测方法_内蒙古工业大学_202210250734.X

一种基于代谢组学的乳腺癌检测生物标志物及其应用_浙江大学_202310211338.0

circSCAP作为激素受体阳性乳腺癌预后标志物或治疗靶点的应用_山东大学齐鲁医院_202410860911.5

卵磷脂在评估难溶化合物与P-糖蛋白和乳腺癌耐药蛋白作用关系中的应用及评估方法_南京药明康德新药开发有限公司_202410695828.7

雌激素受体(ER)阳性样和雌激素受体(ER)阴性样乳腺癌的蛋白质标志物_布普格生物制药公司_202280040438.5

一种用于预测激素受体阳性乳腺癌术前化疗敏感性的试剂盒_中山大学孙逸仙纪念医院_201910526863.5

分类相关技术

一种分类模型的训练、图像分类方法、装置、设备及介质_马上消费金融股份有限公司_202410624324.6

一种基于视觉识别技术的分类压缩垃圾桶及分类方法_南通大学_202410693885.1

一种应用基于BERT模型的文本内容分类系统的分类方法_齐鲁工业大学(山东省科学院)_202410748775.0

一种垃圾分类系统_滨州市滨环城市保洁有限公司_202323391357.0

分类模型训练方法及设备_马上消费金融股份有限公司_202410334192.3

心电信号分类、心电信号分类模型训练方法及电子设备_西安理工大学_202410893058.7

声场景分类模型生成方法、声场景分类方法、装置、存储介质及电子设备_恒玄科技(上海)股份有限公司_202410848719.4

一种交通经济用票据分类装置_滨州市公路事业发展中心_202322897089.3

一种建筑垃圾分类回收装置_合肥大学_202410286882.6

一种垃圾箱分类监管方法_苏州市伏泰信息科技股份有限公司_202411135947.3

药物相关技术

药物递送系统_仁景(苏州)生物科技有限公司_202411138821.1

天然药物在制备抗革兰氏阳性菌药物中的应用_山东省妇幼保健院_202211089794.4

联合用药物在制备抗肿瘤药物中的用途_武汉科技大学_202310431090.9

个人护理或药物组合物_联合利华知识产权控股有限公司_202280086709.0

药物组合物及其制备方法_江苏慧聚药业股份有限公司_202380019341.0

一种颗粒药物制粒机_广东云方制药有限公司_202323434943.9

一种药物储存装置_布拖县人民医院_202323134325.2

一种药物提取罐_石家庄以岭药业股份有限公司_202420161691.2

一种化疗药物配置台_秦皇岛市第一医院_202323117440.9

一种药物萃取装置_定州诺爱医药销售有限公司_202420211548.X

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于R-CNN-GA的抗乳腺癌候选药物分类预测方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务