首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于质谱分析的蛋白质从头肽测序方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:上海中科新生命生物科技有限公司

摘要:本发明提供一种基于质谱分析的蛋白质从头肽测序方法及系统,包括卷积神经网络模型、迁移神经网络模型和多模态数据模型;卷积神经网络模型从原始质谱图中提取出质谱MS1数据和质谱MS2数据,并进行特征提取和处理;迁移神经网络模型对卷积神经网络模型进行深度学习;多模态数据模型利用氨基酸序列对卷积神经网络模型和迁移神经网络模型进行训练和预测,以得到肽段序列。通过质谱MS1数据的离子保留时间对质谱MS2数据进行过滤及筛选,再利用迁移神经网络模型对所述卷积模型进行深度学习,使得最终可精准预测原始图谱的肽段序列,解决了如何提高蛋白质从头肽测序中无参考测序的准确性的问题。

主权项:1.一种基于质谱分析的蛋白质从头肽测序方法,其特征在于,所述蛋白质从头肽测序方法包括:获取原始质谱图,并从所述原始质谱图中提取出质谱MS1数据和质谱MS2数据,包括利用分辨率为0.05、信号最大峰值为1500的质谱分析仪对蛋白质进行质谱分析以得到原始质谱图;从所述原始质谱图中提取离子保留时间和氨基酸序列的信息作为质谱MS1数据;从所述原始质谱图中选取峰值最大的预设个峰进行打质谱MS2图,并从所述质谱MS2图中提取离子保留时间和氨基酸序列进行裂解后断裂的碎片的质量作为质谱MS2数据;利用卷积神经网络将所述质谱MS1数据进行特征提取,以获得一级数据矩阵;利用卷积神经网络将所述质谱MS2数据进行特征提取,以获得二级数据矩阵;根据离子保留时间将所述二级数据矩阵与所述一级数据矩阵相关联,并整合得到卷积模型;利用迁移神经网络模型对所述卷积模型进行深度学习,以获得多模态数据模型;根据氨基酸序列可能存在的情况对氨基酸序列进行编码和分割,以对氨基酸序列进行标准化,具体为:设定氨基酸序列的标准总长度;将氨基酸序列的总长度与所述标准总长度进行对比,若所述氨基酸序列的总长度小于所述标准总长度,则使用空符将所述氨基酸序列的总长度补至所述标准总长度;对每一氨基酸提出6种氨基酸状态,所述6种氨基酸状态包括正向标准氨基酸、负向标准氨基酸、正向缺H2O氨基酸、负向缺H2O氨基酸、正向缺NH3氨基酸和负向缺NH3氨基酸;对总共23种氨基酸的6种氨基酸状态进行编码和分割,以对氨基酸序列进行标准化;利用标准化后的氨基酸序列对所述多模态数据模型进行训练和预测,以得到肽段序列。

全文数据:

权利要求:

百度查询: 上海中科新生命生物科技有限公司 基于质谱分析的蛋白质从头肽测序方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。