恭喜上海天鹜科技有限公司杨晨星获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜上海天鹜科技有限公司申请的专利一种药物分子与靶标蛋白的结合亲和力预测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114783514B 。
龙图腾网通过国家知识产权局官网在2025-06-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210538547.1,技术领域涉及:G16B15/30;该发明授权一种药物分子与靶标蛋白的结合亲和力预测方法是由杨晨星;柯颂;陈俊;郭谦设计研发完成,并于2022-05-18向国家知识产权局提交的专利申请。
本一种药物分子与靶标蛋白的结合亲和力预测方法在说明书摘要公布了:本发明公开了一种药物分子与靶标蛋白的结合亲和力预测方法,使用了新型的蛋白质表征方式,将蛋白质和配体的大量序列数据进行特征整合,提高特征的聚合度,缩小神经网络的搜索空间,并采用了新型神经网络架构,同时利用了循环神经网络和联合注意力机制等方法,对高聚合数据进行进一步处理,通过不断迭代学习数据中的隐含映射关系,从而达到结合亲和力预测。本发明可以帮助药物化学等从事药物发现人员的针对自己靶点的配体分子进行快速筛选,获得潜在的活性化合物,加快药物发现。
本发明授权一种药物分子与靶标蛋白的结合亲和力预测方法在权利要求书中公布了:1.一种药物分子与靶标蛋白的结合亲和力预测方法,其特征在于,步骤为:数据整合;所述整合的数据包括靶标蛋白质的序列和配体分子的SMILES;将靶标蛋白质的序列和配体分子的SMILES整合在整合数据集中;数据编码:对整合数据集中的靶标蛋白质序列和配体分子的SMILES分别进行编码,得到编码数据集;靶标蛋白质序列的编码方法为:对每个靶标蛋白质都用一个设定长度的字符数据集表征;所述的字符数据集中包括表示开始的特殊字符、表征靶标蛋白质序列的字母四元组、表示结束的特殊字符;并且当靶标蛋白质序列的长度小于设定长度时,使用表示填充的特殊字母进行填充占位;所述表征蛋白特征的字母四元组包括二级结构类别、是否暴露在溶剂里、物理化学特性和长度;字母四元组的编码规则为: 配体分子的编码方法为:用一个设置长度的配体数据集表征,所述配体数据集包括表示开始的特殊字符、配体分子的SMILES、表示结束的特殊字符;当配体分子的SMILES的长度小于设置长度时,用表示填充的特殊字母进行填充占位;当配体分子的SMILES的长度大于设置长度时,直接截断;亲和力预测:将编码数据集按批次输入到亲和力预测模型中,得到亲和力预测结果;所述亲和力预测模型,为深度神经网络模型,包括蛋白质网络模块、配体网络模块、卷积池化层、全连接层;蛋白质网络模块的输出和配体网络模块的输出在卷积池化层聚合后输入到全连接层,全连接层输出预测结果;所述蛋白质网络模块包括蛋白质嵌入层、蛋白质RNN层和蛋白质注意力层;配体网络模块包括配体嵌入层、配体RNN层和配体注意力层;在对亲和力预测模型训练时,加入图神经网络对亲和力预测模型进行优化;在对亲和力预测模型训练时,蛋白质网络模块的输出和配体网络模块的输出在卷积池化层聚合后与图神经网络的输出结合后输入到全连接层,所述图神经网络的输入为图结构数据;获取训练集的图结构数据;以蛋白质和分子为节点,提取分子间相互作用的图结构数据;对于每个蛋白质分子,以蛋白质和其配体分子为节点,以其对应的BindingaffinitypIC50orpEC50作为权重的度量,来提取分子间相互作用的图结构数据;具体提取方法有两种,择优使用;一种是根据蛋白质与配体分子结合的IC50值取个阈值,将实际IC50值与阈值对比划分为有效边和无效边,并只保留有效边且将有效边的权重赋值为1;另一种是保留所有有值的边,然后按IC50的大小作为权重;训练时所使用的图神经网络:使用图结构数据,所述图结构数据包括蛋白质序列和小分子的分子指纹数据,以蛋白质序列和小分子的分子指纹数据作为输入,首先将分子指纹数据输入多层感知机进行降维,然后根据上节中权重的赋值规则对权重进行归一化,并更新节点信息,为防止过拟合,使用了dropout方法,然后将数据输出;输出的数据会与CNN层输出数据拼接一起输入全连接层,全连接层:将CNN层与图神经网络的输出数据整合,然后将整合数据进行降维,得到预测的结合亲和力数据。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人上海天鹜科技有限公司,其通讯地址为:200240 上海市闵行区剑川路930号A栋#435;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。