浙江大学朱峰获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浙江大学申请的专利一种基于大语言模型和图像表征的药物-靶点相互作用预测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119993257B 。
龙图腾网通过国家知识产权局官网在2025-09-23发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510068501.1,技术领域涉及:G16B15/30;该发明授权一种基于大语言模型和图像表征的药物-靶点相互作用预测方法是由朱峰;牟敏杰;牛天乐;葛一超;张瀚毓设计研发完成,并于2025-01-16向国家知识产权局提交的专利申请。
本一种基于大语言模型和图像表征的药物-靶点相互作用预测方法在说明书摘要公布了:本发明公开了一种基于大语言模型和图像表征的药物‑靶点相互作用预测方法,使用大语言模型ESM‑2编码靶点序列,使用大语言模型X‑MOL编码药物SMILES,生成特征矩阵,通过图像表征技术生成药物和靶点的二维图像表征;构建药物‑靶点相互作用预测模型MapCPI,将药物和靶点的二维图像表征输入MapCPI,得到药物‑靶点相互作用预测概率,判断药物‑靶点是否发生结合。模型利用这些编码信息,不依赖于靶点结构信息即可有效提取药物‑靶点相互作用特征,从而实现对药物‑靶点相互作用的预测,并且展现出良好的泛化性能。本发明通过结合大语言模型和图像表征技术提高了药物‑靶点相互作用预测的准确度和效率。
本发明授权一种基于大语言模型和图像表征的药物-靶点相互作用预测方法在权利要求书中公布了:1.一种基于大语言模型和图像表征的药物-靶点相互作用预测方法,其特征在于,包括以下步骤: S1:收集药物-靶点相互作用基准数据集,并获取药物SMILES和靶点序列; S2:使用大语言模型ESM-2编码靶点序列,使用大语言模型X-MOL编码药物SMILES,生成特征矩阵,通过图像表征技术生成药物和靶点的二维图像表征,具体包括: 2.1)使用大语言模型ESM-2对蛋白质数据库中的蛋白质序列进行编码生成蛋白编码矩阵,使用大语言模型X-MOL对化合物数据库中所有生物活性化合物进行编码生成化合物编码矩阵,通过平均池化操作将靶点和药物的原始特征矩阵转换成向量; 2.2)基于余弦相似性计算蛋白编码矩阵之间的成对距离生成蛋白特征距离矩阵,同样地基于余弦相似性计算化合物编码矩阵之间的成对距离生成化合物特征距离矩阵,计算公式为: ; 其中a和b代表不同的特征,和表示所有样本在该维特征上组成的特征值向量; 2.3)通过均匀流形近似和投影算法将蛋白特征距离矩阵或者化合物特征距离矩阵进行降维,投影到二维空间,分别得到蛋白特征的散点分布或化合物特征的散点分布; 2.4)使用Jonker-Volgenant算法,将蛋白特征的散点分布或化合物特征的散点分布进行线性分配,得到规则化的蛋白模板图像或规则化的化合物模板图像,规则化的蛋白模板图像和规则化的化合物模板图像构成药物和靶点的二维图像表征; S3:构建药物-靶点相互作用预测模型MapCPI,将药物和靶点的二维图像表征输入MapCPI,得到药物-靶点相互作用预测概率; S4:根据药物-靶点相互作用预测概率判断药物-靶点是否发生结合。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江大学,其通讯地址为:310058 浙江省杭州市西湖区余杭塘路866号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。