一种融合数据平衡与分子碎片化的化合物毒性评价方法

导航：龙图腾网> 最新专利技术> 一种融合数据平衡与分子碎片化的化合物毒性评价方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：重庆大学

摘要：本发明涉及一种融合数据平衡与分子碎片化的化合物毒性评价方法，该方法首先根据毒性端点选择建模方法，然后使用练数据集对两种建模方法下的模型进行训练分别得到全局建模元模型和顺序建模元模型；对待预测化合物分子选择元模型并判断其是否在元模型的应用域内，如果在应用域内则将待预测化合物分子输入对应的元模型中进行预测，并对预测结果进行毒性悬崖测试，通过的预测结果如果大于给定共识分数阈值做则作为最终预测结果输出。如果不在应用域内直接输出无法预测。本方法可以智能灵活地选择合适的建模块，从而在不同的目标上实现化合物毒性属性的准确预测。

主权项：1.一种融合数据平衡与分子碎片化的化合物毒性评价方法，其特征在于，包括如下步骤：S101:选定毒性端点，根据毒性端点对应的可使用的训练数据集的平衡度B选择合适的建模方法：如果训练数据集的平衡度B≤10，则训练数据集为平衡数据集，选择全局建模方法，执行S102，如果训练数据集的平衡度B10，则训练数据集为非平衡数据集，选择顺序建模方法，执行S103；S102:对于给定的训练数据集，依次计算训练数据集中分子的Q种不同的分子指纹f，以分子指纹作为第一元模型块的输入，利用训练数据集中的标签进行有监督学习，并采用随机梯度下降法更新第一元模型块的权重，最终获得Q个全局建模元模型，执行S104；S103:对于给定的训练数据集，对训练数据集中的化合物分子中的原子序号进行标记，提取原子连接信息，并对化合物分子进行选择性分解使其碎片化及序列化，得到正逆两组分子碎片序列；计算训练数据集中分子的Q种不同的分子指纹f；依次利用Q种不同的分子指纹f表征分子碎片得到两组指纹序列S[f1,f2,...,fi]和RS[fi,fi-1,...,f1]作为第二元模型块的输入，使用训练数据集中的标签进行有监督学习，并采用随机梯度下降法更新第二元模型块权重，最终获得Q个顺序建模元模型，执行S104；S104:对于待预测化合物分子，首先选定毒性端点以及对应的一组元模型，共计Q个元模型，利用分子指纹与训练数据集的相似性判断待预测化合物分子是否在全局建模元模型和顺序建模元模型的应用域内，如果是，执行S105，否则执行S112；S105:判定选定的元模型的建模方法，如果是顺序建模方法则执行S106，如果是全局建模方法则否则执行S107；S106:对于在应用域之内的化合物分子，Q个顺序建模元模型得到Q组预测结果，每组预测结果由L1和L2组成，判断L1＝L2是否成立，如果成立则最终预测结果L＝L1＝L2，保留通过一致性检验的最终预测结果{L1,L2，…，Lt}，其中t为保留的预测结果数量，t≤Q,并执行S108；S107:对于在应用域之内的化合物分子，Q个全局建模元模型得到Q个最终预测结果L{L1,L2，…，Li}，i＝7，执行S108；S108:根据端点对应的训练数据集标签类别判断是否为二分类问题，即vT或nT端点，如果是则执行S110，否则执行S109；S109:对每个最终预测结果进行毒性悬崖测试：待预测化合物分子与训练数据集的平均相似距离大于等于崖值，且预测标签结果与训练数据集中最相似分子的标签差绝对值大于等于设定值；保留通过毒性悬崖测试的最终预测结果{L1,L2，…，Lj}，其中j为保留的最终预测结果数量，执行S110；S110:计算共识分数CS，如果CS大于给定共识分数阈值，则保留最终输出结果L并执行S111，否则执行S112；S111：输出最终预测结果；S112：输出“模型无法准确预测该化合物毒性”。

全文数据：

权利要求：

百度查询：重庆大学一种融合数据平衡与分子碎片化的化合物毒性评价方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种酶法合成硒酸软骨素的生物合成方法及其应用

下一篇：一种自动化振动清洗设备

相关技术

一种酶法合成硒酸软骨素的生物合成方法及其应用

一种自动化振动清洗设备

一种固废基改性混凝土及其制备方法

一种电子粉体材料解碎机

一种冷却液直喷散热装置及方法

电池包

一种三维结构仿生水凝胶制备工艺

一种基于IP6加密生成地址系统

一种提高采收率用纳米渗吸驱油剂

一种多种方式方便打开的纸盒及其制备方法

一种L-谷氨酸脱氢酶突变体及其应用

一种欠驱动无人船自适应滑模轨迹跟踪控制方法

碎片化相关技术

一种空间碎片柔性抓捕装置_天津云遥宇航科技有限公司_202420558787.2

再加工切碎并清洗后的消费后塑料废品碎片的设备和方法_施塔林格有限公司_202380020240.5

航天器解体碎片的再入风险度数据的处理方法和装置_北京航天飞行控制中心_202110417514.7

一种皮带运输矿粉中金属碎片检测器_衢州元立金属制品有限公司_202420090790.6

一种可探测空间尘埃与微小碎片的晶圆级太阳帆航天器_山东大学_202410681561.6

一种在freeRTOS下改善heap堆使用中产生大量内存碎片的方法_深圳市云希谷科技有限公司_202411187792.8

图案化组合物、图案化薄膜、图案化基底、半导体器件及其制造方法_珠海基石科技有限公司_202411200625.2

模块化水杯_黄冈市卓源智能科技有限公司_202411154947.8

α化淀粉干燥粉末的制造方法、α化淀粉干燥粉末、α化荞麦干燥粉末及α化淀粉干燥粉末的制造装置_株式会社阿尔法科技_202380021546.2

图案化材料组合物、图案化薄膜、图案化基底、半导体器件及其制备方法_珠海基石科技有限公司_202411179540.0

分子相关技术

用于高分子量材料的挤出装置_苏州金纬机械制造有限公司_202323150916.9

小麦抗寒性状相关KASP分子标记及其应用_河北省农林科学院粮油作物研究所_202411031423.X

高效纯化双抗蛋白分子的层析方法_泰澧生物技术(苏州)有限公司_202410292986.8

HIV特异性结合分子和TCR_英美偌科有限公司_202380022429.8

获取分子性质的方法、装置及存储介质_深圳晶泰科技有限公司_202111635352.0

一种分子筛加热设备_无锡市三晓新材料有限公司_202323519648.3

HELIOS的小分子降解剂及其使用方法_达纳-法伯癌症研究公司_201980079725.5

一种高分子防水卷材_山东佳源防水材料股份有限公司_202322838763.0

一种低分子海参肽分离设备_青岛海泽特生物科技有限公司_202323636986.5

新型拮抗性抗TNFR2抗体分子_生物发明国际公司_202411004492.1

化合物相关技术

化合物及其用途_上海岸阔医药科技有限公司_202380022776.0

胺化合物和包括该胺化合物的有机发光器件_三星显示有限公司_201910501132.5

蒽化合物及包括该蒽化合物的有机发光元件_SFC株式会社_202410696648.0

化合物和使用方法_探戈医药股份有限公司_202380019116.7

芳基磺酰胺化合物_阿纳克西斯制药股份有限公司_202280091908.0

肽化合物的制造方法_中外制药株式会社_202380022408.6

长效GLP-1化合物_甘李药业股份有限公司_202080091240.0

镁化合物的制造方法_株式会社村田制作所_202380024792.3

吩噻嗪系化合物和含有该化合物的固化性树脂组合物_住友化学株式会社_202110564131.2

杀有害生物活性氨硫脲化合物_巴斯夫欧洲公司_202380022257.4

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种融合数据平衡与分子碎片化的化合物毒性评价方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务