买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明公开一种利用小样本数据提升迁移学习文本分类准确率的方法,包括:步骤S1,使用工业互联网数据作为原始训练数据;步骤S2,使用基于LaserTagger数据增强方法对原始训练数据增强,生成更多训练数据;步骤S3,利用增强后数据进行BERT模型训练,具体利用BERT进行文本分类,BERT基于MaskedLanguageModel即MLM作为新的预训练目标语言模型。本发明可在小样本语料利用模型提升工业互联网领域的文本分类识别效果,通过语义和模型的方式,对工业互联网领域增加文本数据量并提高模型的鲁棒性,后利用迁移学习方法识别,降低文本标注数据成本,提高工业互联网领域文本分类效果、模型识别准确率。
主权项:1.一种利用小样本数据提升迁移学习文本分类准确率的方法,其特征在于:该方法具体过程如下:步骤S1,使用工业互联网数据作为原始训练数据;步骤S2,使用种基于LaserTagger的数据增强方法对原始训练数据进行增强,以生成更多的训练数据;步骤S3,利用增强后的数据进行BERT模型训练,具体为利用BERT进行文本分类,BERT基于MaskedLanguageModel即MLM作为新的预训练目标语言模型。
全文数据:
权利要求:
百度查询: 中国工业互联网研究院 一种利用小样本数据提升迁移学习文本分类准确率的方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。