基于简并编码及深度学习的MHC预测模型构建方法及系统

导航：龙图腾网> 最新专利技术> 基于简并编码及深度学习的MHC预测模型构建方法及系统

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：四川大学

摘要：本发明提供了一种基于简并编码及深度学习的MHC预测模型构建方法及系统，构建了能预测Ⅰ类主要组织相容性复合体与抗原肽结合的ConvNeXt‑MHC预测模型，模型主要包括两个部分，第一个部分提供了一种简并编码方法，提高了经典MHCI与多肽的结合性预测模型的泛化性能；第二个部分，设计了ConvNeXt‑MHC模型网络的整体架构，并将迁移学习和半监督学习方法整合到深度学习框架ConvNeXt中，通过扩充数据和增加先验知识的方式提升了模型的准确性和泛化性。本方案可以开展MHCI与多肽的在线结合性预测、多肽的基序分析和数据共享，捕获更丰富的信息，预测效果显著优于现有方法。

主权项：1.基于简并编码及深度学习的MHC预测模型构建方法，其特征在于，所述方法包括：S1、对pMHCI结构数据进行过滤，并对齐不同等位氨基酸残基的位点，得到预处理MHC数据；对MS数据及AF数据进行预处理，得到预处理MS数据及预处理AF数据；S2、获取伪序列位点：基于预处理MHC数据，筛选出与多肽距离小于距离阈值的候选氨基酸序列位点，保存至数据集S，并计算各位点频率；基于截断频率及各位点频率，选取氨基酸序列位点，并删除同源性位点，建立筛选后MHC数据与多肽位点对应关系，以建立伪序列位点矩阵，所述伪序列位点矩阵中各元素表示多肽位点与对应氨基酸序列位点是否接触；S3、按照多肽位点顺序，将与同一个多肽位点残基有接触的多个氨基酸序列位点编码到一个向量，以构建简并编码矩阵；S4、构建MHC模型，所述MHC模型至少包括依次连接的注意力块、第一融合深度卷积块、第一下采样层、第二融合深度卷积块和第二下采样层；所述注意力块为所述简并编码矩阵增加先验知识；S5、通过所述预处理MS数据及所述预处理AF数据，分别训练所述MHC模型，分别获得预测MS数据的抗原呈递模型及预测AF数据的亲和力结合模型；所述S3中，简并编码矩阵的构建方式进一步包括：S31、将多肽转化为九肽，获得九个氨基酸数据，并将对应位置氨基酸进行编码，得到九肽数据；S32、基于预处理MHC数据的类型及类型对应的氨基酸种类，根据伪序列位点矩阵的位置对应关系，将预处理MHC数据转化为伪序列，伪序列中对应位置拥有的氨基酸标记为1，未拥有的标记为0；S33、将所述九肽数据进行20次堆叠，并与所述伪序列进行拼接，得到简并编码矩阵；所述S4中，所述注意力块为所述简并编码矩阵增加先验知识的方式为：首先，统计氨基酸频率，并计算注意力块初始权重：其中，Amio_acid_freq表示二十个氨基酸的频率，h表示二十个氨基酸之一，init_weighth表示注意力块初始权重；其次，构建注意力块中卷积核，并针对简并编码矩阵计算注意力数值[a1；a2；…；aH]：ah＝Conv1DhX[h,:,:],kernal_size＝W,filter＝1其中，Conv1Dh表示对应h层的一维卷积核，kernal_size表示卷积核大小，W为宽度，X[h,:,:]表示简并编码矩阵X按照第一个维度进行切分并获取h层对应的矩阵切片，H表示简并编码矩阵的总层数；再次，将注意力值与简并编码矩阵混合，得到混合注意力简并编码矩阵，混合方式为：X′＝[a1IX[1,:,:],…,aHIX[H,:,:]]其中，I为单位矩阵，aH为上述注意力值；所述混合注意力简并编码矩阵作为注意力块的输出数据；所述第一融合深度卷积块和第二融合深度卷积块具体设置方式为： WiseConvPi,j＝[DepthConvV1,P[:,:,1]i,j；…；DepthConvVc,P[:,:,C]i,j]其中，P＝[P[:,:,1]；…；P[:,:,C]]，矩阵P表示输入矩阵；C表示输入矩阵P的第三个维度的通道数目,c∈C，Vc表示c通道对应的卷积核，K和L表示卷积核大小分别为K和L，k∈K,l∈L，i和j表示在输入矩阵P中前两维度的位置值；DepthConv表示深度卷积计算，WiseConv表示逐点卷积计算。

全文数据：

权利要求：

百度查询：四川大学基于简并编码及深度学习的MHC预测模型构建方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种稠油工况螺杆泵控制系统

下一篇：一种高功率密度增速齿轮箱的模态测试方法

相关技术

一种稠油工况螺杆泵控制系统

一种高功率密度增速齿轮箱的模态测试方法

一种石质文物保护用高耐久透明降温自清洁涂层的制备方法

ZnO/石墨烯复合材料、Zn杂化石墨烯阻燃环氧丙烯酸酯涂层及制备方法

超临界CO₂腐蚀测试系统的样品加载装置

一种弹性卷材的放卷换卷机构

一种精密铜铝铸件切割装置

适用于不同功能空间声场控制的音频处理系统及方法

一种电网高影响天气特征与模式识别方法及系统

半导体用黏合膜、切割晶粒接合一体型膜及半导体装置的制造方法

一种BODIPY类化合物、制备方法及其应用

马达

MHC相关技术

具有人源化免疫球蛋白和MHC基因座的经基因修饰的非人动物_百奥赛图(北京)医药科技股份有限公司_202380027634.3

MHC Ib介导的髓鞘特异性免疫抑制作为针对多发性硬化症和MOG抗体疾病的新型治疗方法_尤利乌斯·马克西米利安维尔茨堡大学_202380029746.2

MHC Ib介导的胰岛抗原特异性免疫抑制作为1型糖尿病的新型疗法_尤利乌斯·马克西米利安维尔茨堡大学_202380029747.7

使用递归神经网络编码器和注意力加权来改进对新表位的主要组织相容性复合物(MHC)-肽结合预测的方法和系统_南托米克斯有限责任公司_201980054372.3

展示单MHC等位基因功能蛋白的工程化细胞_佳吾益(北京)科技有限公司_202411001111.4

用于MHC新抗原肽发现及亲和分析的工程化细胞_佳吾益(北京)科技有限公司_202410998369.X

双重MHC靶向T细胞接合物_CDR-生物科技股份有限公司_202280088909.X

与MHC-肽靶标结合的抗原识别分子的脱靶预测方法_瑞泽恩制药公司_202280091407.2

ALV-J MHC-B21限制性表位肽及其筛选方法和应用_华南农业大学_202310968688.1

一种基于多示例学习的MHC-I类分子新生抗原识别方法_复旦大学_202410599424.8

预测模型相关技术

癌症风险预测模型的训练方法、癌症风险预测方法及装置_中国医科大学附属第一医院_202411228342.9

一种基于混合网络预测模型的曲线预测方法及装置_重庆数元道科技有限公司_202410936297.6

生理状态预测模型的训练方法、样本数据生成及预测方法_北京津发科技股份有限公司_202411009785.9

一种远端模块寿命预测模型的建立方法与寿命预测方法_南京邮电大学_202210317421.1

EBV疗效预测模型的构建方法和EBV手术疗效预测方法_中国人民解放军总医院第一医学中心_202410907441.3

预测模型的训练方法、预测方法及相关设备_深圳依时货拉拉科技有限公司_202411455690.X

滑转率预测模型的训练方法及滑转率的预测方法_西北农林科技大学_202411448406.6

基于GA-BP预测模型的大规模定制化排样用料问题预测方法_三峡大学_202410872521.X

基于EEG建立用于认知功能预测的线性回归模型的方法和系统_浙江大学_202411035242.4

一种基于大语言模型的电力需求预测方法_北京瑞智德信息技术有限公司_202411455825.2

学习相关技术

一种基于深度学习的学习质量评价系统及方法_成都工业学院_202411444397.3

一种基于自监督学习的纵向联邦学习方法_上海工程技术大学_202410871430.4

机器学习模型的联邦学习中的压缩的梯度分组_高通股份有限公司_202380031178.X

学习机的控制方法、控制装置及学习机_深圳倍爱思科技有限公司_202411140185.6

学习系统、确定系统和预测系统以及学习方法、确定方法和预测方法_富士胶片株式会社_202380031812.X

人体穴位学习系统、学习方法及人体穴位模型制作方法_中医古籍出版社有限公司_202411333351.4

一种智能学习机_北京信息职业技术学院_202411010868.X

在内代理语音以促进任务学习_渊慧科技有限公司_202380031694.2

一种平板学习机_南京百舸争流网络科技有限公司_202411116116.1

一种学习桌_育才控股集团股份有限公司_202323640076.4

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于简并编码及深度学习的MHC预测模型构建方法及系统

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务