首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于门控注意力机制的靶标-配体结合亲和力的深度学习预测方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:大连理工大学

摘要:本发明涉及基于门控注意力机制的靶标‑配体结合亲和力的深度学习预测方法,属于计算机辅助药物设计技术以及生物和药物信息学领域。深度学习模型从配体的SMILES字符串和蛋白质的氨基酸序列开始,然后分别转换为配体矩阵和蛋白质矩阵。配体矩阵被送到全连接层和基于门增强的注意力层用于特征提取,将蛋白质矩阵送到一维卷积层和最大池化层,然后再送入基于门增强的注意力层。最后,通过矩阵行的加和来聚合配体矩阵的处理特征,并对蛋白质矩阵执行相同的过程,然后将两者拼接在一起送入后续的全连接层以预测蛋白质‑配体复合物的高低结合亲和力的概率。本发明有效减少与实验分析相关的时间和成本,提高药物设计和虚拟筛选的效率。

主权项:1.基于门控注意力机制的靶标-配体结合亲和力的深度学习预测方法,其特征在于,包括以下具体步骤:步骤1:建立结合亲和力数据库,用于后续的深度学习模型;步骤2:将配体的SMILES字符串转换为配体矩阵,作为深度学习模型的输入;步骤3:将蛋白质的氨基酸序列转换为蛋白质矩阵,作为深度学习模型的输入;步骤4:构建用于模型训练的深度学习模型的架构,将配体矩阵送到一个全连接层和一个基于门增强的注意力层用于特征提取,通过矩阵行的加和方式来聚合配体片段的特征向量;步骤5:将蛋白质矩阵先送到一维卷积层和最大池化层,以减少蛋白质矩阵的行数,然后再送入基于门增强的注意力层用于特征提取,通过矩阵行的加和方式来聚合蛋白质高阶氨基酸的特征向量;步骤6:将聚合后的配体片段的特征向量与蛋白质高阶氨基酸的特征向量拼接在一起送入后续的全连接层以预测靶标-配体复合物的高低结合亲和力的概率;步骤1具体包括:根据以下标准对结合亲和力数据库进行预处理:步骤1.1:删除涉及IC50性质的条目,保留涉及Ki和Kd性质的条目;步骤1.2:删除RDKit工具读取配体结构文件失败或Mol2vec方法找不到配体Morgen片段的条目;步骤1.3:分别删除Morgen片段或氨基酸数大于阈值的靶标-配体复合物条目;步骤1.4:Kidn的靶标-配体复合物标记为高结合亲和力,用“1”表示,而Kid≥n的靶标-配体复合物标记为低结合亲和力,用“0”表示,Kid表示Ki或Kd,n表示抑制或解离常数阈值;最后,在应用上述步骤1.1-1.4标准后,获得独特的靶标-配体复合物样本存储在结合亲和力数据库中,用于后续的深度学习模型;步骤2具体包括:步骤2.1:使用Morgan算法将分子的SMILES字符串表示转换为Morgen片段;步骤2.2:将Mol2vec中的Morgen片段的特征向量嵌入到步骤2.1得到的Morgen片段中;将每个分子的Morgen片段的特征向量求和来表示整个分子的特征向量;步骤2.3:基于Mol2vec描述符,每个配体样本由一个二维矩阵表示,其中矩阵行表示Morgen片段,矩阵列表示片段的特征向量;步骤3具体包括:步骤3.1:将蛋白质序列中每三个相邻的氨基酸视为一个高阶氨基酸;通过这种方式,将结合亲和力数据库中的蛋白质编写成高阶氨基酸字符串;步骤3.2:通过深度学习模型中的嵌入方法,给每个高阶氨基酸字符串嵌入一个特征向量;步骤3.3:每个蛋白质样本由一个二维矩阵表示,其中,矩阵行表示高阶氨基酸字符串,矩阵列表示高阶氨基酸字符串的特征向量。

全文数据:

权利要求:

百度查询: 大连理工大学 基于门控注意力机制的靶标-配体结合亲和力的深度学习预测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

-相关技术