首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种OCR单字符定位识别方法、系统及计算机存储介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:杭州汇萃智能科技有限公司

摘要:本发明公开了一种OCR单字符定位识别方法、系统及计算机存储介质。所述方法包括:获取待识别图像中的字符串二值图,所述字符串二值图是对待识别图像进行预处理后得到的;对字符串二值图进行去干扰;基于尺寸的动态投影算法对去干扰后的二值图进行字符串定位;利用笔画组合区域划分算法初步确定字符串笔画检索区域;对字符串笔画检索区域中的笔画进行组合;根据笔画组合获取字符定位框完成对字符的定位;采用灰度+HOG处理定位框中的字符数据;训练分类器,并利用训练后的分类器对经灰度+HOG处理定位框中的字符图像识别,输出识别结果。本发明可有效提高OCR单字符定位识别的准确性。

主权项:1.一种OCR单字符定位识别方法,其特征在于,所述方法包括:获取待识别图像中的字符串二值图,所述字符串二值图是对待识别图像进行预处理后得到的;对字符串二值图进行去干扰;基于尺寸的动态投影算法对去干扰后的字符串二值图进行字符串定位;根据定位后的字符串,利用笔画组合区域划分算法确定字符串笔画检索区域;对字符串笔画检索区域中的笔画进行组合;根据笔画组合获取字符定位框完成对字符的定位;采用灰度处理和方向梯度直方图算法处理字符定位框中的字符数据;利用训练后的分类器对经灰度处理和方向梯度直方图算法处理后的字符进行识别,输出识别结果;所述基于尺寸的动态投影算法对去干扰后的字符串二值图进行字符串定位,包括:对去干扰后的字符串二值图中的连通域进行面积筛选,检索面积在预设最小面积和预设最大面积之间的连通域;对面积在预设最小面积和预设最大面积之间的连通域进行纵向闭运算,消除字符间隙;对消除字符间隙后的字符串二值图进行归一化;并对归一化后的字符串二值图进行横向求和投影,得到横向投影向量图;判断横向投影向量图的向量中,是否存在横向连通域高度是在最小字符高度和最大字符高度之间,若是,则该横向连通域的上下位置即为字符串的上下边界;若否,则将向量的每一位减去一个预设减数,再通过迭代的方式直到出现高度在最小字符高度和最大字符高度之间的连通域,再定位出上下边界;所述利用笔画组合区域划分算法初步确定字符串笔画检索区域,包括:将定位后的字符串二值图中的字符串区域切割出来;对切割后的字符串二值图进行横向闭运算,再进行归一化处理;对归一化后的字符串二值图进行纵向求和投影,投影得到纵向投影向量图;对纵向投影向量图中的每一个向量都减去纵向投影阈值,获取纵向连通域;通过每个纵向连通域的左右区间在切割后的字符串二值图的图像中限制检索区域,在每一个检索区域中定位字符;检索所有笔画连通域,如果笔画宽度大于预设的最大字符宽度,说明笔画处有连接,在切割后的字符串二值图的图像中按照笔画宽度截取区域图像,进行垂直投影,计算投影向量每一个位置的左右差值,如果差值大于字符切割阈值,则该位置为切割点,对该笔画在切割点上进行切割;所述对字符串笔画检索区域中的笔画进行组合,包括:对笔画检索区域的笔画提取轮廓;保存每个笔画轮廓的点集;对笔画轮廓点集进行排序,排序规则为所有笔画最小包围矩从左到右的顺序;利用笔画组合算法对笔画进行组合。

全文数据:

权利要求:

百度查询: 杭州汇萃智能科技有限公司 一种OCR单字符定位识别方法、系统及计算机存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。