Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于异质网络嵌入的中药药方活性成分群预测方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:东南大学

摘要:本发明公开一种基于异质网络嵌入的中药药方活性成分群预测方法,依次包含以下步骤:依次包括以下顺序执行的步骤:步骤1.从公开的数据库中搜集中药药方的分子和西药分子的靶标,通路,GOterm信息,构建药物分子信息网络;基于构建的药物分子信息网络,按照西药分子和中药药方所能治疗的疾病的相关性,生成西药分子的标签。步骤2.通过异质网络嵌入学习方法分析步骤1得到的药物分子信息网络,得到中药药方分子和中药药方所治疗疾病的相关的西药分子的嵌入表示;步骤3.根据步骤2得到的嵌入表示,利用聚类算法分析中药分子和西药分子的嵌入表示,预测中药药方的活性成分群,本方法能够提高中药活性成分群筛选的效率及准确率,有助于中药药方的开发。

主权项:1.一种基于异质网络嵌入的中药药方活性成分群预测方法,其特征在于:依次包括以下顺序执行的步骤:步骤1.药物分子信息网络的构建:从公开的数据库中搜集中药药方的分子和西药分子的靶标,通路,GOterm信息,同时从公开数据及中搜集疾病和西药分子的关联关系,基于上述数据,构建药物分子信息网络;基于构建的药物分子信息网络,根据西药分子-疾病关系,按照西药分子和中药药方所能治疗的疾病的相关性,生成西药分子的标签,使用独热编码表示;所述步骤1具体包括以下步骤:步骤1.1:中药药方数据收集:首先,对于每个中药药方,通过数据库搜集中药药方所含有的化学分子信息,包括分子的名称,CAS号,相关靶点;根据口服生物利用度OB=30%,类药性DL=0.18对药方的药物分子进行初步筛选,得到所要研究的中药药方的成分分子集合;接着,通过分子靶标数据库检索每个成分的靶点信息;步骤1.2:西药数据搜集:通过公开数据库搜集西药分子所能治疗的疾病名称,分子相关的靶标信息;步骤1.3:在得到中药药方靶点和西药分子靶点信息之后,通过网络爬虫技术从公开数据库中得到靶点相关的KEGG通路、GOterm信息;步骤1.4:基于搜集到的数据构建药物分子信息网络,所述药物分子信息网络的节点为疾病、药方、中药分子、西药分子、靶点、通路、GOterm,所述药物分子信息网络的边有药方-中药分子,分子-靶点,靶点-通路,靶点-GOterm,药方-疾病,西药分子-疾病;步骤1.5:基于构建的药物分子信息网络,根据西药分子-疾病关系,按照西药分子和中药药方所能治疗的疾病的相关性,生成西药分子的标签;步骤2.药物分子信息网络的嵌入:根据步骤1得到的药物分子信息网络,所述药物分子信息网络是一个异质网络,通过异质网络嵌入学习方法,得到中药药方分子和中药药方所治疗疾病的相关的西药分子的嵌入表示;所述步骤2具体包括以下步骤:步骤2.1:针对步骤1中构建的药物分子信息网络,为网络中的所有节点生成一个独热编码作为网络中节点的初始特征;步骤2.2:异质互注意力计算:针对步骤1中构建的药物分子信息网络,对于一个节点t,其邻居节点s∈Nt可能属于不同的节点类型,它们的相互注意力需要根据它们的边的类型来计算;对于网络中的每一条边e=s,t,计算h-head注意力,具体的计算过程如下: 其中,h是注意力头的个数,是每个注意力头的向量维度,τ*表示将节点*映射到其类别集合,φe将边e映射到边的类别集合,Hl-1[*]表示节点*在l-1层的表示;步骤2.3:异质信息传播针对步骤1中构建的药物分子信息网络,从源节点向目标节点做消息传播,初始消息使用步骤2.1中为所有节点生成的独热编码;对于边e=s,t,多头的消息计算为: 其中h是注意力头的个数,是每个注意力头的向量维度;步骤2.4:异质信息聚合针对步骤1中构建的药物分子信息网络,当步骤2.2异质互注意力和步骤2.3异质信息计算完成后,需要对目标节点t聚合所有邻居节点s∈Nt的异质消息,从而获得药物分子异质信息网络的节点之间的内在联系,异质消息聚合的计算方式如下: 得到后为了得到l层的节点表示,需要按照目标节点的类别,使用线性映射A-Linearτt映射到对应类别的分布中,节点的表示计算为: 将步骤2.2到步骤2.4的过程重复L次,就为步骤1中构建的药物分子信息网络的每个节点得到有丰富信息的上下文表示HL;步骤2.5:异质网络嵌入学习针对步骤1中构建的药物分子信息网络,步骤1.5基于构建的药物分子信息网络,根据西药分子-疾病关系,按照西药分子和中药药方所能治疗的疾病的相关性,生成西药分子的标签,同时步骤2.4生成了节点的表示;由于西药分子和中药分子在网络中是同一类的节点,因此本方法设计了一个针对西药分子节点分类任务来更新网络中的参数,从而获得异质网络所有节点最终嵌入结果;具体的,针对步骤2.4得到的节点表示HL,将西药分子节点的表示作为MLP分类器的输入,输出对应于步骤1.5生成的分子标签;将西药分子随机划分为80%的训练集,20%的验证集,损失函数使用交叉熵损失函数,Adam作为优化器,然后使用预测损失的梯度更新模型参数,从而获得药物分子信息网络中所有分子节点的网络嵌入;步骤3.聚类分析预测中药药方活性成分群:根据步骤2得到的嵌入表示,利用聚类算法分析中药分子和西药分子的嵌入表示,从而得到多个聚类簇,统计各个聚类簇的基本信息,所述聚类簇的基本信息包括中药分子个数、西药分子个数,将能够和西药分子聚类的中药分子作为活性成分群。

全文数据:

权利要求:

百度查询: 东南大学 一种基于异质网络嵌入的中药药方活性成分群预测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。