恭喜中科南京智能技术研究院杨远翔获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜中科南京智能技术研究院申请的专利一种基于深度学习扩散生成的抗体序列生成方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118942533B 。
龙图腾网通过国家知识产权局官网在2025-06-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411426755.8,技术领域涉及:G16B15/30;该发明授权一种基于深度学习扩散生成的抗体序列生成方法及装置是由杨远翔;胡蝶;吕艾芬;刘小壮;范成旺;汤锦;何伟;尚德龙;周玉梅设计研发完成,并于2024-10-14向国家知识产权局提交的专利申请。
本一种基于深度学习扩散生成的抗体序列生成方法及装置在说明书摘要公布了:本发明公开了生物医药技术领域的一种基于深度学习扩散生成的抗体序列生成方法及装置,其方法包括:初始化生成初始抗体CDR序列;获取用于训练的抗体抗原复合物数据,并进行解析、修复、分类、特征构建的预处理,预处理后进行抗体序列生成器训练;训练后对初始抗体CDR序列进行逐步去噪,在每步均生成一个目标抗体CDR序列,并分别与模版抗体序列拼合生成目标抗体序列;获取各个目标抗体序列对应的蛋白质结构,并和用户输入的抗体抗原复合物数据中抗原的蛋白质结构进行物理拼接,生成目标抗原抗体复合物;采用抗原抗体结合性评价方法筛选出最优的目标抗原抗体复合物,得到最优目标抗体序列。本发明能够高效准确的生成目标抗体序列。
本发明授权一种基于深度学习扩散生成的抗体序列生成方法及装置在权利要求书中公布了:1.一种基于深度学习扩散生成的抗体序列生成方法,其特征在于,包括:初始化生成初始抗体CDR序列;所述初始抗体CDR序列为一个完全随机的噪声数据;通过训练好的抗体序列生成器对所述初始抗体CDR序列进行逐步去噪,在每步均生成一个目标抗体CDR序列;将各个所述目标抗体CDR序列分别与模版抗体序列拼合生成目标抗体序列;通过蛋白质结构预测模型对各个所述目标抗体序列进行蛋白质结构预测生成相应的蛋白质结构;将各个预测生成的所述蛋白质结构和用户输入的抗体抗原复合物数据中抗原的蛋白质结构进行物理拼接,生成目标抗原抗体复合物;采用抗原抗体结合性评价方法对各个所述目标抗原抗体复合物进行评价,筛选出最优的目标抗原抗体复合物,并输出其对应的目标抗体序列;其中,所述抗体序列生成器的训练包括:构建深度学习扩散生成模型,所述深度学习扩散生成模型包括扩散模型、残基嵌入模块以及残基序列预测模块;所述残基嵌入模块和所述残基序列预测模块构成所述抗体序列生成器;获取用于训练的抗体抗原复合物数据,并进行预处理,生成抗体抗原复合物样本数据;所述扩散模型包括扩散过程和逆扩散过程,在扩散过程中,对抗体抗原复合物样本数据中的抗体CDR序列进行逐步的随机加噪操作,在逆扩散过程中,通过所述抗体序列生成器对扩散过程最终得到的抗体CDR序列进行逐步的去噪操作;通过加噪操作生成的抗体CDR序列和所述抗体序列生成器生成的抗体CDR序列计算模型损失并反向传播优化所述抗体序列生成器的模型参数,完成训练;所述抗体序列生成器通过最大化变分下界来最小化模型损失;所述变分下界为: ;式中,为在扩散过程中第0步的抗体CDR序列所服从的近似后验分布的期望,将抗体抗原复合物样本数据中的抗体CDR序列的概率分布作为近似后验分布;为在扩散过程中第1步的抗体CDR序列在给定第0步的抗体CDR序列下的条件概率分布期望;为在逆扩散过程中第0步的抗体CDR序列在给定第1步的抗体CDR序列下的条件概率分布的对数似然;为KL散度函数,为在扩散过程中第T步的抗体CDR序列在给定抗体CDR序列下的条件概率分布,T为扩散过程或逆扩散过程中的总步数;为预先设置的先验分布,将扩散过程最终得到的抗体CDR序列的概率分布作为先验分布;为在扩散过程中第步的抗体CDR序列在给定抗体CDR序列下的条件概率分布期望;为在扩散过程中第步的抗体CDR序列在给定抗体CDR序列下的条件概率分布;为在逆扩散过程中第步的抗体CDR序列在给定第步的抗体CDR序列下的条件概率分布; ;式中,,,为矩阵转置,为逐元素乘法,为由参数指定的描述的分类类别分布;为在扩散过程中第步的转移概率矩阵,为转移概率矩阵中第行第列的元素; ; 为抗体序列的分类类别数量,为第步的数列,数列随步数递减;基于所述变分下界构建模型损失的损失函数: ;式中,为超参数,为在逆扩散过程中抗体CDR序列在给定抗体CDR序列下的条件概率分布的对数似然;其中,所述残基嵌入模块包括第一特征提取单元、第二特征提取单元以及第三特征提取单元;所述第一特征提取单元包括依次连接的第一线性层、第一Than层、恒等映射层、第二线性层以及第二Than层;从所述抗体抗原复合物样本数据中获取二面角信息和位置编码,并融合得到二面角结构特征;将所述二面角结构特征输入第一特征提取单元中,生成结构特征嵌入向量;所述第二特征提取单元包括第一嵌入层;从所述抗体抗原复合物样本数据中获取原子种类和位置编码,并融合得到原子种类特征;将所述原子种类特征输入第二特征提取单元,生成原子种类嵌入向量;所述第三特征提取单元包括第二嵌入层;从所述抗原抗体复合物样本数据中获取残基种类和位置编码,并融合得到残基种类特征;将所述残基种类特征输入第三特征提取单元,生成残基种类嵌入向量;通过广播机制对齐所述结构特征嵌入向量、所述原子种类嵌入向量以及所述残基种类嵌入向量的维度,并相加生成序列特征嵌入向量;其中,所述残基序列预测模块包括依次连接的多个Transformer解码器和预测器;所述Transformer解码器包括依次连接的多头注意力层、第一层归一化层、前馈神经网络层以及第二层归一化层,且所述多头注意力层的输入和所述第一层归一化层的输出相加连接,所述前馈神经网络的输入和所述第二层归一化层的输入相加连接;所述前馈神经网络层包括依次连接的放大线性层、第一ReLU层以及收缩线性层;所述预测器包括依次连接的第五线性层、第二ReLU层、第六线性层以及第三ReLU层;将所述残基嵌入模块获取的序列特征嵌入向量输入所述残基序列预测模块,生成抗体CDR序列;其中,所述扩散过程中随机加噪操作是一种预定义的马尔可夫链过程,其转移概率为,分别为扩散过程中的第步的抗体CDR序列;所述逆扩散过程中去除噪声的操作是一种参数化的马尔可夫链过程,其转移概率为,分别为逆扩散过程中的第步的抗体CDR序列,为抗体序列生成器的模型参数。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中科南京智能技术研究院,其通讯地址为:211135 江苏省南京市江宁区创研路266号麒麟人工智能产业园8栋8层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。