东北农业大学周长建获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉东北农业大学申请的专利一种基于TransGAT的药物-靶标相互作用预测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116312808B 。
龙图腾网通过国家知识产权局官网在2025-07-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310302892.X,技术领域涉及:G16B40/00;该发明授权一种基于TransGAT的药物-靶标相互作用预测方法是由周长建;向文胜;宋佳;钟玉杰设计研发完成,并于2023-03-24向国家知识产权局提交的专利申请。
本一种基于TransGAT的药物-靶标相互作用预测方法在说明书摘要公布了:本发明涉及人工智能与药物发现相关领域,具体来说,发明了一种基于Transfrormer、图注意力网络和双注意力特征融合模块相结合的药物‑靶标相互作用预测方法。由于传统的药物‑靶标相互作用分析往往需要耗费大量的人力物力以及时间成本,并且实验失败风险较高。本发明结合Transformer和图注意力网络两种模型架构的优势,并利用双注意力机制特征融合方法,将融合后的特征输入到分类器进行药物‑靶标相互作用预测。该方法经过在公开数据集上通过一系列评估指标测试明显优于现有方法,为药物‑靶标相互关系预测提供新思路。
本发明授权一种基于TransGAT的药物-靶标相互作用预测方法在权利要求书中公布了:1.一种基于TransGAT的药物-靶标相互作用预测方法,其特征在于,包括以下步骤: S1:数据获取,从药物-靶标数据库中选取药物信息,蛋白质信息和药物-靶标对信息,其中药物信息采用SMILES格式,蛋白质信息采用FASTA格式; S2:数据预处理,本实例中药物采用的SMILES格式是一种二维结构图形式,表示为:D=ν,ξ,其中D代表药物,ν和ξ分别代表图的顶点和边,在本实例中节点和便分别表示药物分子的原子和化学键,在特征提取过程为便于计算,每个药物分子结构用一个特征矩阵和一个邻接矩阵表示,其中Ni是药物分子的第i个原子,K代表原子的特征维度,本实例中蛋白质采用FASTA格式表示,这是一种长序列形式,表示为:ρ=ρ1,ρ2,...,ρn,其中抖代表蛋白质中第i个氨基酸; S3:设计TransGAT模型,该模型综合利用Transformer、图注意力网络和双注意力特征融合三个模块的优势,其中Transformer在蛋白质序列编码有较强的优势,图注意力网络能更加深入的提取对预测结果有利的药物特征,双注意力特征融合模块突出药物-靶标对特征信息,进一步增加模型预测的精度;该模型主要分为以下三个功能:1特征编码模块,其中蛋白质编码方式如下:该模块创建了一个可学习的嵌入矩阵其中包含23个氨基酸类型,DP代表矩阵的维度,通过查找嵌入矩阵,将每个蛋白质序列初始化为相应的特征矩阵其中θ是蛋白质序列的最大允许长度,再将每个蛋白质序列切割为最大允许长度内的片段,并用零填充长度较短的片段,并在训练期间分批处理,Transformer编码器从蛋白质特征矩阵中提取局部特征信息,蛋白质编码层从大小为3的每三组数据输入到6层Transformer编码器中,经过编码后输出蛋白质特征编码;药物编码方式如下:将药物化学式结构看成图数据,其中每个原子都以74维整数向量表示,该向量描述了8种特性,分别是:原子类型、度、隐式Hs数、形式电荷、自由基电子数、原子杂交、总Hs以及原子是否为芳香原子,共使用6层图注意力网络GAT来学习药物化合物的图表示,图注意力网络GAT通过聚合其相应的邻域原子集来更新原子特征向量,这些邻域原子通过化学键相连,药物编码器的结构表示为其中eij表示节点i与节点j之间的注意力值,LeakyReLU是激活函数,和W是可学习参数,每一层的可学习参数是相同的,代表节点i的特征向量;2特征融合模块,特征融合模块利用双注意力机制,对前面输入的特征编码进行深度融合,该模块由两层组成:一个双线性交互映射用于捕获成对注意力权重,以及一个双线性池化层用于在交互映射上提取联合药物-目标表示,双线性交互映射可以获得单个头成对交互,这些元素表示相应药物-目标子结构对的交互强度,并映射到潜在的结合位点和分子亚结构,通过在交互映射上引入双线性池化层,获得联合表示向量,多头交互比单头交互具有更好的性能,最后,该模型可以显式学习药物和蛋白质之间成对的局部相互作用,在特征融合后的药物-靶标对中,已知存在相互关系的药物-靶标形成的药物-靶标对是阳性的,其余的药物-靶标对是阴性的;3药物-靶标相互关系预测模块,该模块将融合后的特征输入到多层感知机进行分类,以预测输入目标药物和蛋白质之间是否有关系,多层感知机利用sigmoid函数,将输出映射到介于0到1之间的概率值,表示药物靶点相互作用的可能性; S4:设置TransGAT模型参数,激活函数采用ReLU函数,损失函数采用二值交叉熵BinaryCross-Entropy损失函数,优化函数采用adam,迭代次数是200,Transformer层数为6,GAT层数为6,特征融合注意力机制头数是2,特征融合模块嵌入size是768; S5:采用训练集对TransGAT模型进行训练,采用步骤S4设定的超参数训练模型,直到模型不在收敛为止,停止训练并保存训练好的模型; S6:模型封装,形成基于TransGAT的药物-靶标相互作用预测模型。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东北农业大学,其通讯地址为:150030 黑龙江省哈尔滨市香坊区长江路600号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。