买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明公开了一种基于CNN‑Attention‑GNN模型的多肽结构鉴定方法及其应用,方法包括:对收集的多肽质谱信息进行预处理,建立标准化多肽数据集;设计并训练基于CNN‑Attention‑GNN架构模型,模型包括:肽离子峰鉴定层用于识别质谱峰中的碎片离子;节点嵌入层则通过卷积神经网络和自注意力机制进行特征提取,以捕捉有意义的信息;图神经网络层负责捕捉质谱峰中碎片离子之间的复杂关系,以提升模型推断的准确性;输出层通过Softmax和全连接层等操作生成最终的多肽序列;最后,将待测质谱数据输入训练好的模型,生成预测结果。本发明通过结合CNN网络、自注意力机制、图神经网络以及多肽谱峰间的相关联系,为生物领域的研究和生物活性肽的发展提供坚实基础。
主权项:1.一种基于CNN-Attention-GNN模型的多肽结构鉴定方法,其特征在于,包括如下步骤:S1:获取多肽质谱信息,并将多肽质谱信息进行预处理,得到标准数据集;所述预处理包括:对质谱数据进行鉴定分析,将二级原始谱图信息与鉴定所得多肽序列进行关联匹配,获得匹配结果;S2:构建多肽结构鉴定基础模型,并将所述数据集输入模型进行学习,得到训练模型;所述多肽结构鉴定基础模型包括:肽离子峰鉴定层:用于识别谱峰中的碎片离子;节点嵌入层:用于编码离子峰信息,在噪音中识别有用的离子信息,其主要架构为卷积神经网络包含卷积层、池化层、自注意力层、激活层以及全连接层;GNN层:用于捕获多肽谱图中不同碎片离子之间的复杂关系,帮助模型识别碎片之间的隐藏关系,进而更准确地推断肽段序列;输出层:用于输出模型预测的多肽序列,包含Softmax层、全连接层;所述多肽结构鉴定基础模型构建方法:S210:计算每个谱峰中当前位置的碎片离子以及其对应互补离子的理论值;S220:将S210得到的所有离子类型输入节点嵌入层,进行卷积计算、自注意力计算、池化得到一个包含谱峰信息的向量;S230:将S220中的输出作为GNN网络的初始节点嵌入,在两个节点之间建立一条边,直到所有的谱峰都被转换成图的形式,通过汇聚邻居节点的消息更新当前节点与其邻居节点之间的信息;S240:将S230输出的信息输入全连接层,进行线性变换操作,输出预测结果,形成训练模型;S3:将待测质谱数据输入所述训练模型,获得预测结果。
全文数据:
权利要求:
百度查询: 五邑大学 一种基于CNN-Attention-GNN模型的多肽结构鉴定方法及其应用
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。