买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:华东师范大学
摘要:本发明公开了一种基于不平衡数据的CRISPR系统脱靶位点预测方法,包括以下步骤:1获取公开数据集;2数据层面处理;3sgRNA向导RNA序列编码;4模型训练;5代价敏感损失函数处理;6预测gRNA‑DNA对的脱靶活性;7结果评价:评价和分析不同方法和不同模型的预测结果。从数据处理到模型训练阶段都充分考虑了数据集中正负样本的不平衡问题,通过采用过采样、欠采样或复合采样等处理方法,以调整数据集中的正负样本比例,从而提高了模型对不平衡数据的适应能力;通过采用Focalloss或GHMloss作为损失函数,从而提高模型的鲁棒性;通过构建两种脱靶预测模型,并对它们进行综合比较分析,进一步提高了CRISPR系统脱靶预测的可信度。
主权项:1.一种基于不平衡数据的CRISPR系统脱靶位点预测方法,其特征在于,包括以下步骤:1获取公开数据集:获取两组CRISPR脱靶数据集,分别指定用于模型训练和测试:第一组数据集用于训练模型,第二组数据集用于评估模型的泛化性;2数据层面处理:选择对数据进行过采样、欠采样或者复合采样的处理,调整正负样本比例;3sgRNA向导RNA序列编码:对所述公开数据集进行预处理,并使用特定的编码方式对所述公开数据集的sgRNA序列进行编码;4模型训练:构建两种脱靶预测模型,并分别用经过预处理的训练集进行训练;5代价敏感损失函数处理:在模型训练时,选择使用Focalloss或者GHMloss作为损失函数;6模型应用:将待测sgRNA序列输入所述训练好的预测模型中,预测gRNA-DNA对的脱靶活性;7结果评价:评价和分析不同方法和不同模型的预测结果。
全文数据:
权利要求:
百度查询: 华东师范大学 一种基于不平衡数据的CRISPR系统脱靶位点预测方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。