首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于深度稀疏表示网络的DNA结合蛋白识别方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:苏州科技大学

摘要:一种基于深度稀疏表示网络的DNA结合蛋白识别方法,包括以下具体步骤:获取DNA结合蛋白序列数据集,分为训练集和测试集;采用PSL‑BLAST软件计算DNA结合蛋白序列数据集内所有序列的特异性打分矩阵;将所有的特异性打分矩阵分别填充或裁剪成相同尺寸的新特异性打分矩阵;采用深度稀疏表示网络构建并训练DNA结合蛋白识别分类器模型,将新特异性打分矩阵输入DNA结合蛋白识别分类器模型内,完成对DNA结合蛋白序列的识别。构建并训练出的DNA结合蛋白识别分类器模型是一种端到端的网络,能够明显的提高预测精度,误差较小,采用卷积自编码器可以鲁棒地学习特异性打分矩阵的潜在特征,并通过稀疏表示层进行分类,提高了模型的泛化能力。

主权项:1.一种基于深度稀疏表示网络的DNA结合蛋白识别方法,其特征在于:包括以下具体步骤:S1,获取DNA结合蛋白序列数据集,所述DNA结合蛋白序列数据集分为训练集和测试集;S2,采用PSL-BLAST软件计算所述DNA结合蛋白序列数据集内所有序列的特异性打分矩阵;S3,将所有的所述特异性打分矩阵分别填充或裁剪成相同尺寸的新特异性打分矩阵;S4,采用深度稀疏表示网络构建并训练DNA结合蛋白识别分类器模型;S5,将步骤S3中的所述新特异性打分矩阵输入所述DNA结合蛋白识别分类器模型内,完成对所述DNA结合蛋白序列的识别,具体包括:S41,将步骤S1中的所述训练集和所述测试集进行行拼接得到拼接数据集其中Xtrain为所述训练集,所述训练集Xtest为所述测试集,所述测试集其中,d0表示所述训练集和所述测试集的维度,n表示训练集样本个数,m表示测试集样本个数;S42,将所述拼接数据集X输入包含编码器、解码器和稀疏表示层的深度稀疏表示网络模型中,所述拼接数据集X经过所述编码器输出编码Z,Z=[Ztrain,Ztest],其中,Ztrain表示训练集编码,Ztest表示测试集编码,所述编码Z经过所述稀疏表示层得到其中即可定义In是单位矩阵,0n×m,0m均为0矩阵,A为稀疏表示矩阵,通过所述深度稀疏表示网络的目标函数其中,是所述解码器的输出,表示训练集解码,表示测试集解码,所述λ0=0.1和λ1=0.1,λ0和λ1均为正则化参数,即可计算出所述稀疏表示矩阵A;S43,取所述测试集Xtest中任意一个测试样本其对应的测试样本编码为其对应的在所述稀疏表示矩阵A中的相关稀疏编码列为αi,定义新向量中的非0元素是和αi相关的k类元素,任意一个测试样本的分类公式为完成对所述DNA结合蛋白识别分类器模型的构建和训练。

全文数据:

权利要求:

百度查询: 苏州科技大学 基于深度稀疏表示网络的DNA结合蛋白识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。