买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:北京思图场景数据科技服务有限公司
摘要:本发明公开了基于单字符及文字间连接关系预测的文字检测方法及装置,包括以下步骤:训练神经网络模型;通过所述神经网络模型进行特征提取,得到特征图,所述特征图包括字符位置分数图Text‑map和字符间连接关系分数图Link‑map,对Text‑map和Link‑map进行后处理,在每一块连通域上计算其最小外接矩形,实现从图片中检测出文字的位置。本发明基于字符级别的预测模型可以迫使模型的卷积核更多的关注字符级特征,可以在后处理分支有效的将模型学习到的字符级特征关联起来,实现了长文本的检测且避免了字符的漏检。
主权项:1.基于单字符及文字间连接关系预测的文字检测方法,其特征在于,包括以下步骤:训练神经网络模型;通过所述神经网络模型进行特征提取,得到特征图,所述特征图包括字符位置分数图Text-map和字符间连接关系分数图Link-map,对Text-map和Link-map进行后处理,所述后处理的步骤如下:将Text-map转化为二值图Bm1,对Text-map设置阈值λ1,将Link-map转化为二值图Bm2,对Link-map设置阈值λ2,将二值图Bm1初始化为0,当对应位置的特征图值大于阈值λ1时二值图Bm1上该位置值为1;将二值图Bm2初始化为0,当对应位置的特征图值大于阈值λ2时二值图Bm2上该位置值为1;在所得到的二值图Bm1和二值图Bm2上执行连通域分析,此时得到所有文字区域的像素;在每一块连通域上计算其最小外接矩形,实现从图片中检测出文字的位置;所述Text-map上对于原图中每一个字符位置产生一个特定的高斯图单元,所述高斯图单元的生成是预先生成一个二维的标准高斯特征图,计算标准高斯特征图和文字包围框四个坐标的透视变换矩阵,将标准高斯特征图通过透视变换,转移到包围框区域;所述Link-map上对于原图中每一个实例产生一个代表实例连接关系的二值图单元;对于Link-map的生成,首先对每一个字符包围框画一条对角线,此时将得到上下两个三角形,接下来再将所有同属于一个实例的上三角形和下三角形的重心分别连接得到上下两条线,再闭合两条线段即得到代表实例连接关系的多边形包围框。
全文数据:
权利要求:
百度查询: 北京思图场景数据科技服务有限公司 基于单字符及文字间连接关系预测的文字检测方法及装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。