首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

字符识别模型训练的数据增强、字符识别的方法及装置 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:有米科技股份有限公司

摘要:本发明公开了一种字符识别模型训练的数据增强、字符识别的方法及装置,该方法通过在训练出收敛后的字符识别基础模型之后且在判断出训练样本图像的预测结果与训练样本图像的样本标签匹配之后,基于训练样本图像的每个预测字符在收敛后的字符识别基础模型的每个输出标签上的概率,对当前训练样本图像执行数据增强操作,能够获取到不同方向字符的增强训练样本图像,实现训练样本图像的数据增强,有利于通过数据增强后的训练样本图像继续对收敛后的字符识别基础模型进行半监督式的训练,有利于增强字符识别基础模型对任意方向文字的识别能力,以及无需大量的训练样本,不仅提高了字符识别基础模型的训练准确性,还提高了字符识别基础模型的训练效率。

主权项:1.一种字符识别模型训练的数据增强方法,其特征在于,所述方法包括:在确定出收敛后的字符识别基础模型之后,基于收敛后的所述字符识别基础模型对当前训练样本图像执行预测操作,得到收敛后的所述字符识别基础模型的分析结果,收敛后的所述字符识别基础模型的分析结果包括所述当前训练样本图像的预测结果以及所述当前训练样本图像的每个预测字符在收敛后的所述字符识别基础模型的每个输出标签上的概率,所述当前训练样本图像的每个所述预测字符的类型包括空字符类型或非空字符类型,收敛后的所述字符识别基础模型包括多个所述输出标签,所述当前训练样本图像的预测结果为收敛后的所述字符识别基础模型识别到所述当前训练样本图像中类型为所述非空字符类型的所有所述预测字符的识别结果;判断所述当前训练样本图像的预测结果是否与所述当前训练样本图像的样本标签匹配,所述当前训练样本图像的样本标签用于表示所述当前训练样本图像中类型为所述非空字符类型的所有所述预测字符的真实结果;当判断出匹配时,根据所述当前训练样本图像的每个所述预测字符在收敛后的所述字符识别基础模型的每个所述输出标签上的概率,对所述当前训练样本图像执行数据增强操作,得到数据增强后的训练样本图像,所述数据增强后的训练样本图像用于对收敛后的所述字符识别基础模型执行训练操作;所述根据所述当前训练样本图像的每个所述预测字符在收敛后的所述字符识别基础模型的每个所述输出标签上的概率,对所述当前训练样本图像执行数据增强操作,得到数据增强后的训练样本图像,包括:根据所述当前训练样本图像的每个所述预测字符在收敛后的所述字符识别基础模型的每个所述输出标签上的概率,对所述当前训练样本图像的所有所述预测字符执行分割操作,得到所述当前训练样本图像中类型为所述非空字符类型的每个所述预测字符在所述当前训练样本图像中的位置区域;对所述当前训练样本图像中类型为所述非空字符类型的所有所述预测字符中至少一个预测字符执行任意角度或者预设角度的旋转操作;对所述当前训练样本图像中类型为所述非空字符类型的所有所述预测字符执行拼接操作,得到字符拼接后的训练样本图像,所述字符拼接后的训练样本图像用于对收敛后的所述字符识别基础模型执行训练操作,所述数据增强后的训练样本图像为所述字符拼接后的训练样本图像;其中,所述非空字符类型的每个所述预测字符在所述当前训练样本图像中的位置区域通过所述当前训练样本图像的尺寸、所有所述输出标签的数量、类型为所述非空字符类型的每个所述预测字符对应的输出标签的位置及所述当前训练样本图像的每个所述预测字符在收敛后的所述字符识别基础模型的每个所述输出标签上的概率确定。

全文数据:

权利要求:

百度查询: 有米科技股份有限公司 字符识别模型训练的数据增强、字符识别的方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。