买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:电子科技大学长三角研究院(衢州)
摘要:本发明提供了一种mRNA亚细胞定位模型的训练方法包括以下步骤:获取mRNA亚细胞位置序列样本集;根据多种特征提取算法对mRNA亚细胞位置序列样本集进行特征提取,利用基分类器分别对特征识别,并对基分类器一层以上集成,再根据特征提取算法和集成分类器,得到目标mRNA亚细胞定位模型。本发明通过对多个分类器集成学习训练,不但可以提高训练的效率,使得模型在训练过程更容易得到全局最优解,从而得到训练完成后的目标模型会有更优秀的预测能力和泛化能力。
主权项:1.一种mRNA亚细胞定位模型的训练方法,其特征在于,包括以下步骤:S1获取mRNA亚细胞位置序列样本集;S2根据多种特征提取算法对mRNA亚细胞位置序列样本集进行特征提取,得到多个特征集;S3根据多个基分类器分别对多个所述特征集进行识别,并对基分类器进行至少一层集成,得到集成分类器;S4根据所述多种特征提取算法和所述集成分类器,得到目标mRNA亚细胞定位模型其中,步骤S3为:根据多个基分类器分别对多个所述特征集进行识别,并对基分类器进行两层集成,得到两层的集成分类器,具体包括以下步骤:S31根据多个基分类器分别对多个所述特征集进行识别,得到预测结果;所述基分类器包括LightGBM算法;S32根据基分类器对应的所述特征集,基于序列特征和理化特征,对基分类器进行分组,赋予不同的权重,得到基分类器组;S33根据网格搜索和评估算法,得到目标权重参数,评估算法具体包括以下步骤:ACC算法、recall算法、Precision算法、F1-score算法;计算公式如下: ,当真实标签为正样本时,TP、FN分别表示样品的预测结果为正或负的样本数量;当样本的真标签为负,TN、FP分别表示预测标签为负或预测标签为正;S34根据基分类器、基分类器组和目标权重参数,得到两层的集成分类器。
全文数据:
权利要求:
百度查询: 电子科技大学长三角研究院(衢州) mRNA亚细胞定位模型训练方法、定位方法及可读存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。