Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种识别DNA序列中增强子及其活性强度的预测方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:桂林电子科技大学

摘要:本发明公开了一种识别DNA序列中增强子及其活性强度的预测方法,采用独热编码One‑hot和核苷酸化学性质NCP进行编码。使用改善的密集连接网络(DenseNet)从原始的特征编码中提取高级特征;利用自注意力模块对高级特征的重要性进行评估,然后输入到全连接神经网络中得到预测概率;采用五折交叉验证的评估方式对模型性能进行评估,通过投票对最终分类结果进行集成学习;使用灵敏度(Sn)、特异性(Sp)、准确度(Acc)、马修斯相关系数(MCC)和ROC曲线下面积(AUC)等五个评估指标衡量模型;采用独立测试和进行模型预测能力的验证,相比于最先进的方法,我们的模型在识别增强子及其强度上有了显著的性能提升。

主权项:1.一种识别增强子及其活性强度的预测方法,其过程包括如下步骤:1)收集样本数据集:获取训练集和独立测试集的正样本DNA序列和负样本DNA序列;2)特征编码:使用采用独热编码One-hot和核苷酸化学性质NCP进行特征编码,最终每一条序列均由一个二维数值矩阵表示;3)模型构建:获取特征编码后,利用改进的密集连接网络(DenseNet)提取高级特征,使用自注意力机制(Self-attention)评估相对重要的特征,输入到多层感知机(MLP)得到最后的预测结果;4)模型调优:利用批量归一化、dropout和早停法等方法对预测模型进行优化,5)集成模型:模型使用五重交叉验证,其中每一重都使用一个独立的测试集进行测试,每个测试增强子序列产生五个预测概率,最后使用集成学习进行分类投票;6)模型评估:基于5折交叉验证和独立测试进行模型评估,具体使用敏感性(Sn)、特异性(Sp)、准确率Acc、马修斯相关系数(MCC)进行性能衡量。

全文数据:

权利要求:

百度查询: 桂林电子科技大学 一种识别DNA序列中增强子及其活性强度的预测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。