买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:上海精诚智研生物医药有限公司
摘要:本发明公开了一种基于伪标签注意力的药物靶标亲和力预测方法、设备及介质,方法包括:1对待预测的蛋白质和药物分子对进行特征提取和向量表示,输入到循环神经网络模型和多层感知机模型中。2使用伪标签注意力模型分别为蛋白质和药物分子产生多种关注模式的向量,并拼接二者得到蛋白质药物分子的交互模式向量序列。3使用Transformer模型对该交互模型向量序列进行自我信息聚合与传递,并通过前馈神经网络层对输出的结果进行进一步非线性变换,得到最终的该蛋白质与该药物分子的亲和力预测结果。本发明相比于一般的药物靶标亲和力预测方法有着更强的泛化能力和鲁棒性,且复杂度与药物分子或蛋白质序列的长度也呈线性关系,有着更好的可扩展性和长度外推性。
主权项:1.一种基于伪标签注意力的药物靶标亲和力预测方法,其特征在于,包括以下步骤1对输入的蛋白质序列和药物分子按逐个氨基酸、原子以及SMILES中的逐个符号分别进行向量化;2使用BiLSTM和MLP对向量化后的蛋白质和药物分子数据进行初步特征抽取;3对抽取到的特征序列进行伪标签attention计算,分别对蛋白质特征和药物特征计算m种attention模式,其中每种attention模式分别对应某一类蛋白质或药物分子的特性模式。该m种attention方式对应将整个蛋白质或药物特征序列以m种加权求和方式进行加权求和,共可分别得到m个蛋白质和药物分子的伪标签向量;4将蛋白质的m个伪标签向量与药物分子的m个伪标签向量拼接并输入Transformer模型中进行自我交互与信息传递并得到蛋白质与药物分子的结合向量,模拟蛋白质与小分子的结合过程;5使用前馈神经网络结合该Transformer模型的输出以及蛋白质的kmer特征、药物分子的指纹特征进行多层的非线性变换与残差连接,实现最终的药物靶标亲和力预测。
全文数据:
权利要求:
百度查询: 上海精诚智研生物医药有限公司 一种基于伪标签注意力的药物靶标亲和力预测方法、设备及介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。