Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜华东师范大学吴坚获国家专利权

恭喜华东师范大学吴坚获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜华东师范大学申请的专利一种基于深度学习的化合物-蛋白质相互作用预测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114360638B

龙图腾网通过国家知识产权局官网在2025-04-04发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111530765.2,技术领域涉及:G16B15/30;该发明授权一种基于深度学习的化合物-蛋白质相互作用预测方法是由吴坚;钱莹设计研发完成,并于2021-12-15向国家知识产权局提交的专利申请。

一种基于深度学习的化合物-蛋白质相互作用预测方法在说明书摘要公布了:本发明公开了一种基于深度学习的化合物‑蛋白质相互作用预测方法,该方法包括的步骤:步骤A,使用CNN模块学习化合物图片的局部特征再使用Transformer编码器对学习的特征进行语义关系学习;步骤B,使用k‑gram方法对蛋白质序列进行划分,再使用数个Transformer编码器进行语义关系学习;步骤C,对化合物和蛋白质学习到的特征进一步学习,步骤D,经过一个全连接层得到预测结果。本发明提出一种预测精度高、可以有效捕获化合物分子图片特征的方法。

本发明授权一种基于深度学习的化合物-蛋白质相互作用预测方法在权利要求书中公布了:1.一种基于深度学习的化合物-蛋白质相互作用预测方法,其特征在于:该方法包括以下具体步骤:1获得化合物分子的特征图,具体包括:1.1根据化合物分子的SMILES序列,通过RDkit软件生成化合物分子图片;1.2将生成的化合物分子图片输入到CNN模块中学习特征,其中图片大小为H×W×3,H和W分别代表图片的长和宽,3代表图片的颜色通道;使用CNN模块学习化合物分子图片的局部特征,CNN模块的组成为:卷积层、BatchNormalization层、LeakyReLU函数激活层、卷积层、BatchNormalization层、LeakyReLU函数激活层及最大池化层;通过CNN学习后的特征图的大小为m和n分别代表通过CNN学习后化合物分子特征图的长和宽,c代表该特征图的通道;1.3根据获得的特征图XCNN,按照其通道维度展平作为Transformer的输入token,新的特征图大小为其中m·n为化合物分子特征图的长和宽相乘,c为该特征图的通道;1.4将新的特征图Xtoken作为Transformer编码器的输入,然后通过数个Transformer编码器学习特征图中的语义关系,每一个Transformer编码器的组成如下:1.4.1LayerNormalization层对不同长度的数据做处理;1.4.2多头注意力层将输入向量转换为三个不同的向量,其维度都为d:查询向量q、关键向量k、值向量v,将所述向量压缩到对应的矩阵Q、K、V中,其计算过程为:计算查询矩阵Q与关键矩阵K的分数为:S=Q·KT,规范化梯度稳定性分数为:使用softmax函数将分数转化为概率:P=softmaxSn,获得加权值矩阵:Attention=V·P;整个过程的公式为:其中softmax代表softmax激活函数,Q和V代表查询向量q和值向量v压缩的对应矩阵,KT代表关键向量压缩的对应矩阵的转置,dk代表当前的输入维度;然后,为了解决自注意力对位置信息不敏感的问题,将相同维度的位置编码添加到原始输入嵌入中,其公式为:pos表示单词在句子中的位置,i表示位置编码的当前维度,d是输入向量的维度;总注意力由多个头注意力组合而成:MultiHeadQ′,K′,V′=concathead1,...,headhWO,concat表示拼接操作,WO为可学习的特征转换矩阵,headi代表了每一个注意力头的Attention的值,h代表了总共有h个注意力头;1.4.3再经过多层感知机层获得最后的语义信息特征图;多层感知机层的流程为:全连接层,GELU激活层,DropPath层,全连接层,DropPath层;1.5通过数个Transformer编码器的学习表示,获得了最终的化合物分子的特征图XC;2获得蛋白质序列的特征图,具体包括:2.1蛋白质序列为FASTA格式,其中序列由氨基酸组合而成并且氨基酸均以单个字母来表示;采用k-gram方法,对蛋白质序列进行单词划分,每个单词的长度都为k;2.2对划分的单词建立字典,按照最先出现的单词进行升序排序,使用字典的序号来代替原蛋白质序列的表示单词,然后再对每个单词所表示的序号进行嵌入表示;2.3加入原单词在蛋白质序列中的位置信息,经过数个Transformer编码器模块,学习蛋白质序列中各个单词之间的语义信息;2.4通过数个Transformer编码器模块学习后,获得了蛋白质序列的最终特征图XP;3对化合物分子的特征图XC和蛋白质序列的特征图XP进行进一步学习并预测最终结果,具体包括:3.1将所述特征图XC和所述特征图XP通过多层感知机进行特征的浅层次学习;3.2将两张特征图进行叠加处理,再使用一个CNN模块进行深层次的特征学习;CNN的模块设计为:卷积层,BatchNormalization层,LeakyReLU函数激活层,最大池化层,卷积层,BatchNormalization层,LeakyReLU函数激活层,最大池化层;3.3将特征图展平,通过一个全连接层获得最终的预测结果,结果表示为0或1,其中0代表化合物和蛋白质没有相互作用,1则代表有相互作用。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人华东师范大学,其通讯地址为:200241 上海市闵行区东川路500号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。