一种融合生物物理特征的蛋白质翻译后修饰位点功能串扰的预测方法

导航：龙图腾网> 最新专利技术> 一种融合生物物理特征的蛋白质翻译后修饰位点功能串扰的预测方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：苏州大学

摘要：本发明公开了一种融合生物物理特征的蛋白质翻译后修饰位点功能串扰的预测方法，从PhosphoSitePlus、iPTMnet、EPSD及CPLM数据库获取蛋白质序列及翻译后修饰位点信息；从Uniprot、AphaFold数据库获取蛋白质序列和结构数据信息；构建蛋白质翻译后修饰功能串扰预测模型，利用该预测模型对蛋白质翻译后修饰位点功能串扰信息进行预测。本发明在引入动力学特征及蛋白质‑蛋白质互作图特征等基于生物物理特征的基础上，整合全连接网络模型、图嵌入模型及随机森林模型，构建一个主动学习的翻译后修饰功能串扰的预测模型；相比于其它翻译后修饰功能串扰模型具有较高的预测准确性。

主权项：1.一种融合生物物理特征的蛋白质翻译后修饰位点功能串扰的预测方法，其特征在于：包括，从PhosphoSitePlus、iPTMnet、EPSD及CPLM数据库获取蛋白质序列及翻译后修饰位点信息；从Uniprot、AphaFold数据库获取蛋白质序列和结构数据信息；构建蛋白质翻译后修饰功能串扰预测模型，利用该预测模型对蛋白质翻译后修饰位点功能串扰信息进行预测；其中，构建蛋白质翻译后修饰功能串扰预测模型，包括，构建第一子网、构建第二子网和构建第三子网，其中，所述构建第一子网，包括，计算蛋白质翻译后修饰位点残基的序列特征：从UniProt数据库获取蛋白质的序列数据信息，并通过同源序列搜索获得多序列比对，计算蛋白质翻译后修饰位点残基的保守性和共演化信息；其中，保守性香农熵计算公式如下：HX＝-∑iPxilog2Pxii表示所有序列中翻译后修饰位点残基的位置，pxi表示xi的概率函数；共演化信息计算的互信息矩阵是基于香农熵，测量给定随机变量Y下随机变量X的不确定度，其公式如下：MIX,Y＝HX-HX|Y＝HX+HY-HX,Y其中，HX是香农熵，HX|Y＝HX,Y－HY，HX,Y是两个随机变量的香农熵，其公式如下：其中，pxi表示在序列i位置观察到氨基酸x的概率，pxi,yj表示在相应序列位置i和j观察到氨基酸x和y的联合概率，K和L均表示蛋白质氨基酸的序列长度；计算蛋白质翻译后修饰位点残基的结构和动力学特征：首先从AlphaFold数据库获取蛋白质的结构数据信息，使用蛋白质侧链网络计算蛋白质翻译后修饰位点残基的三维结构的网络特征，并使用粗粒化网络模型计算其一系列的动力学特性；其中，在蛋白质侧链网络计算中通过使用氨基酸残基的Cα原子作为节点来构建蛋白质侧链网络：如果至少有一个侧链原子对在截止距离内，则在节点对之间用边连接，节点间相互作用强度计算如下：其中，Iij是残基i和j之间的相互作用强度，nij是截止距离内的原子对的数量，Ni、Nj是残基i和j的归一化值；在构建好蛋白质侧链网络的基础上，计算蛋白质翻译后修饰位点残基的拓扑特征介数：节点介数是指通过节点的所有最短路径与网络中最短路径总数之比，其公式如下：其中njk是连接蛋白质侧链网络中任意节点j和节点k的最短路径数，而njki是连接节点j和节点k并通过节点i的最短路径数，反映了节点在特定网络拓扑中位置的重要程度，能有效区分模块的内外边；计算蛋白质翻译后修饰位点残基的拓扑特征紧密度：紧密度表征了局部度量，反映了节点自身的关联能力，不考虑其他节点的控制问题，其公式如下：其中，di,j表示蛋白质侧链网络中节点j到任意节点i的路径；在粗粒化网络模型计算中，粗粒化网络模型中蛋白质残基的波动服从高斯分布，节点代表蛋白质残基，每个残基均由其碳原子表示，边代表残基之间的相互作用；如果残基之间的距离小于截止距离rc，则将残基连接起来，通常rc取残基间的相互作用势能，公式如下：其中Υij为力常数，ΔRij为残基i，j之间的波动；在构建好粗粒化网络模型的基础上，计算蛋白质翻译后修饰位点残基的波动性大小，公式如下：ΔRi2＝ΔRi·ΔRi＝3kBTγ[Γ-1]ii其中kB为玻尔兹曼常数，T代表绝对温度，[Γ-1]ii为基尔霍夫矩阵的倒数；计算蛋白质翻译后修饰位点残基的动力学性质互相关性：互相关性提供了残基之间相对运动的信息，相关性的归一化形式如下：其中，ΔRi表示第i个残基从其平衡位置的位移的向量；其中，μik是第k个特征向量的第i个残基，λk是第k个特征值，N是目标残基的数量；Cij的值介于-1和1之间，Cij的绝对值越大，表示两个残基之间的相关性越高；将得到蛋白质翻译后修饰位点残基的序列、结构及动力学特征后，将序列特征向量与结构动力学特征相乘后展平成一维特征向量Fp，使用全连接神经网络模型对提取的特征Fp进行预处理，得到每个蛋白质翻译后修饰位点残基的特征向量Tw28维，即为第一子网，其中，所述预处理得到每个蛋白质翻译后修饰位点残基的特征向量Tw28维，包括，给每一个输入向量Fp分配权值，计算出一个权重向量Tw28维；Tw公式如下：Tw＝MT×Fp+b其中，M是线性网络中的权值向量，Fp是展平处理后的蛋白质序列结构动力学特征向量，b是权和偏置向量，MT是指M向量的转置向量；所述构建第二子网，包括，使用基于图形和统计特征的蛋白质序列编码工具FEGS对蛋白质序列进行编码，通过整合蛋白质序列的图形和统计特征，得到500维向量作为每个蛋白质序列的特征向量；利用图编码工具SDNE对蛋白质-蛋白质互作信息进行编码，将生成的蛋白质序列编码的特征作为蛋白质-蛋白质互作网络各节点的特征，得到每个蛋白质的特征矩阵Xi120维；将翻译后修饰功能串扰对形成一个加权的无向图，其中，将每个蛋白质对之间的翻译后修饰功能串扰数作为无向图中边的权重；结合来自蛋白质-蛋白质互作和蛋白质序列编码的特征矩阵，加入翻译后修饰功能串扰的图嵌入层，并使用图编码方式Linear_VAE来提高对翻译后修饰功能串扰的预测效果，得到的特征向量称为Tpair；构建第三子网：对前两个子网的位点特征和网络特征进行特征融合，经过随机森林模型对翻译后修饰串扰给出预测打分，包括，将第一子网获得的特征集矩阵记为Tw；将第二子网获得的特征集矩阵记为Tpair；输入Tw和Tpair计算双线性特征,双线性特征计算公式为：fb＝Tw×Tpair其中，fb表示双线性特征；随后将fb展平为一维向量fc，将其传入预测模型，计算串扰的预测分数，其中，预测模型为：其中，Wc是分类模型的权重矩阵，类似于Softmax函数的权重矩阵。

全文数据：

权利要求：

百度查询：苏州大学一种融合生物物理特征的蛋白质翻译后修饰位点功能串扰的预测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：基于区域人体感应的通风柜控制方法及系统

下一篇：人体属性的识别方法、装置、电子设备及存储介质

相关技术

基于区域人体感应的通风柜控制方法及系统

人体属性的识别方法、装置、电子设备及存储介质

纵置混动变速箱机械泵

一种恒压输出调光电路

快速滤波器校准方法

一种组装单元体用稳态调节控制系统

镭雕装置

一种1.0-2.0mm厚度热基镀锌原料的生产方法

一种高压线路电气控制机构

挖掘装置极限工况的结构优化方法、装置、设备及介质

一种能自动弹出的抽屉式车载冰箱

一种具有护针功能的旋梭及缝纫机

功能相关技术

多功能撬棍_厦门融通骏业消防设备有限公司_202420033196.3

多功能艾灸仪_湖北千吉灸科技有限责任公司_202322903480.X

多功能干衣机_珠海格力电器股份有限公司_202410914277.9

多功能美容道具_崔宽镐_202322202869.1

多功能发声装置_瑞声光电科技(常州)有限公司_202410927019.4

多功能光源系统_广州光联电子科技有限公司_202420359947.0

多功能物料分选机_广东联讯智能装备有限公司_202323366063.2

多功能取栓系统_深圳腾复医疗科技有限公司_202411147328.6

多功能井筒调节系统_欧洲钻井项目有限公司_202280080295.0

全功能大角度底盘_博克精密部件(广东)有限公司_202420158113.3

蛋白质相关技术

一种测定蛋白质含量的比色管_冬青(天津)生物科技有限公司_202323587523.4

用于液体蛋白质浓缩物或分离物的挤出方法_布勒股份公司_202380020720.1

蛋白质酪氨酸磷酸酶抑制剂_ARRAY生物制药公司_201980068343.2

一种蛋白质-多酚共价加合物及其制备方法与应用_东莞理工学院_202410973958.2

一种基于深度学习的蛋白质动力学波动预测方法_上海月新生科信息科技有限公司_202410863434.8

一种激光显微切割样品的蛋白质组学制备方法_北京正达康健生物医学科技有限公司_202410896272.8

蛋白质Z负载黄腐酚在降尿酸产品中的应用_中国农业大学_202410664487.7

基于序列和结构进行多模态蛋白质表征的计算机装置、方法及应用_中国人民解放军军事科学院军事医学研究院_202410826227.5

细菌胞外蛋白质酸碱稳定性数据库及其的构建方法及应用_深圳太力生物技术有限责任公司_202310301401.X

一种解朊金黄杆菌发酵生产蛋白质谷氨酰胺酶的方法_华东师范大学_202310262262.4

修饰相关技术

一种双键芳基化修饰方法_深圳先进技术研究院_202310270759.0

抗大量细胞裂解的基因修饰的细菌_阿西耶斯生物公司_202380017475.9

一种经修饰的CaPif1解旋酶及其应用_北京普译生物科技有限公司_202211132258.8

一种经修饰的核苷单体及双链核糖核酸_石药集团中奇制药技术(石家庄)有限公司_202480000060.5

一种结合神经网络模型的核酸修饰位点识别方法_电子科技大学长三角研究院(衢州)_202410638063.3

便携式体外血液细胞基因编辑或修饰系统_北京昌平实验室_202380017905.7

一种Ag@LSMC纳米复合材料及修饰电极的制备方法_深圳可孚生物科技有限公司_202211244522.7

一种纳米颗粒修饰固体氧化物燃料电池制备方法_东南大学_202411147923.X

掺锡氧化镍贵金属修饰的MEMS甲醛传感器及制备方法_西安交通大学_202210480855.3

经修饰的高丝氨酸O-乙酰基转移酶及其应用_湖南利尔生物科技有限公司_202310265255.X

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种融合生物物理特征的蛋白质翻译后修饰位点功能串扰的预测方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务