广东电网有限责任公司江门供电局;广东电网有限责任公司张盛洪获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉广东电网有限责任公司江门供电局;广东电网有限责任公司申请的专利一种基于注意力机制的OCR文字识别方法和系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115497095B 。
龙图腾网通过国家知识产权局官网在2026-03-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211182141.0,技术领域涉及:G06V30/14;该发明授权一种基于注意力机制的OCR文字识别方法和系统是由张盛洪;张国慧;张志坚;罗瑞明;王硕君;英树祥;邓雄文;梁岸平;蒋秀设计研发完成,并于2022-09-27向国家知识产权局提交的专利申请。
本一种基于注意力机制的OCR文字识别方法和系统在说明书摘要公布了:本发明提供了一种基于注意力机制的OCR文字识别方法和系统,通过使用带有注意力机制的多尺度特征融合方法能够保留更多文本特征,从而改善文本的漏检情况。另外在获得最终特征图时使用坐标注意力来捕捉远距离的特征相关性,更有利于长文本的检测。同时采用了简单的后处理,提高了文本检测的准确度与推理速度,进而使文本的识别结果更准确。
本发明授权一种基于注意力机制的OCR文字识别方法和系统在权利要求书中公布了:1.一种基于注意力机制的OCR文字识别方法,其特征在于,包括如下步骤: 将输入待识别的图片进行图像预处理,并构建所需要的词库; 将处理后的图片送入文本检测网络,得到文本边界框坐标,所述文本检测网络基于注意力机制对所述处理后的图片进行文本特征检测; 根据文本边界框的坐标对输入图像进行裁剪,得到一系列仅包含一行文本行的图片; 将裁剪后的图片依次送入文本识别网络,经所述词库对比后得到最终的文本识别结果; 将处理后的图片送入文本检测网络,得到文本边界框坐标,所述文本检测网络基于注意力机制对所述处理后的图片进行文本特征检测,具体包括: 将处理后的图像送入残差骨干网络进行特征的初步提取; 残差网络共有四个残差模块,取出每一个残差模块的最后一层特征图,构建成特征金字塔,从上到下分别记为第1、2、3、4层; 先对第1、2层的特征进行注意力特征融合并进行卷积操作,得到矫正后的第1、2层特征图; 将矫正之后的第2层特征图与第3层特征图进行上述注意力特征融合操作,之后将得到的矫正之后的第3层特征图与第4层特征图进行注意力特征融合操作; 对矫正之后特征金字塔的各层上采样至低层特征图的尺度进行拼接; 将得到拼接之后的特征图经过坐标注意力进行特征的二次重矫正; 设置像素阈值为0.2,将最终的特征图中大于0.2的值置为1,小于等于0.2的值置为0,得到二值化图; 在所述二值化图中1表示文本区域,0表示非文本区域,使用opencv中的函数得到文本轮廓,选取置信度最大的文本框作为最终的文本轮廓,从而得到文本边界框的坐标。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人广东电网有限责任公司江门供电局;广东电网有限责任公司,其通讯地址为:529000 广东省江门市蓬江区建设二路152号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励