买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本公开涉及一种文本识别模型训练方法、识别方法、装置、介质和电子设备,其中训练方法包括:获取多个样本文本图像;将每个样本文本图像的高度缩放至同一指定高度,并根据每个样本文本图像的宽度和第一预设阈值对每个样本文本图像的宽度进行缩放,以得到对应的多个目标文本图像;将多个目标文本图像划分为多个图像集合,每个图像集合中的目标文本图像的宽度相同,而不同图像集合中的目标文本图像的宽度不同;通过多个图像集合中的目标文本图像分批次对预先构建的文本识别模型迭代训练,直至文本识别模型的损失函数值满足预设条件时结束训练得到文本识别模型,能够最大程度保留图像信息,模型训练的速度比较快,精度也比较高。
主权项:1.一种文本识别模型训练方法,其特征在于,包括:获取多个样本文本图像;将每个所述样本文本图像的高度缩放至同一指定高度,并根据每个所述样本文本图像的宽度和第一预设阈值对每个所述样本文本图像的宽度进行缩放,以得到对应的多个目标文本图像;其中,所述多个目标文本图像的宽度至少部分不相同;将所述多个目标文本图像划分为多个图像集合;其中,每个所述图像集合中的目标文本图像的宽度相同,而不同所述图像集合中的目标文本图像的宽度不同,所述多个图像集合是互斥的;通过多个图像集合中的目标文本图像分批次对预先构建的文本识别模型迭代训练,直至所述文本识别模型的损失函数值满足预设条件时结束训练得到文本识别模型;所述文本识别模型包括特征提取层、特征融合层和长短时记忆网络层;所述通过多个图像集合中的目标文本图像分批次对预先构建的文本识别模型迭代训练,直至所述文本识别模型的损失函数值满足预设条件时结束训练得到文本识别模型,包括:从多个图像集合中随机选择一个图像集合,并从该一个图像集合中随机选择部分目标文本图像进行以下训练:利用所述特征提取层提取选择的所述目标文本图像的特征,得到对应的第一特征图和第二特征图,其中,所述第一特征图为整个目标文本图像的特征图,所述第二特征图为目标文本图像中字符对应的特征图;利用所述特征融合层将所述第一特征图和所述第二特征图基于通道相乘,得到第三特征图;利用所述长短时记忆网络层基于所述第三特征图,获得文本预测结果;根据所述文本预测结果和所述目标文本图像对应的标记图像计算损失函数值,并基于所述损失函数值更新所述文本识别模型的网络参数;重复执行所述选择部分目标文本图像进行训练的迭代过程,直至所述文本识别模型的损失函数值满足预设条件时结束训练得到文本识别模型。
全文数据:
权利要求:
百度查询: 深圳市星桐科技有限公司 文本识别模型训练方法、识别方法、装置、介质和设备
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。