首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种面向文字识别的图像质量自动评估方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:山东浪潮科学研究院有限公司

摘要:本发明属于图像分析技术领域,具体涉及一种面向文字识别的图像质量自动评估方法及系统,本发明通过对文字区域进行质量预测,并计算出图像的质量预测分数,有助于实现对图像中文字区域的精准质量评估。并且根据将计算出的质量预测分数与预设的质量分数阈值进行比较,并在计算出的质量预测分数小于预设阈值时,阻止对图像的文字进行识别,有助于有效地避免低质量图像对OCR识别准确率的影响,提升整个OCR系统的稳定性和工作效率。

主权项:1.一种面向文字识别的图像质量自动评估方法,其特征在于,包括以下步骤:步骤一、获取图像;步骤二、自动定位并提取出图像中的文字区域;步骤三、提取文字区域的语义特征,根据所提取的语义特征,对文字区域进行质量预测,并计算出图像的质量预测分数;其中,语义特征包括多层次全局语义特征和多尺度局部失真特征;步骤四、判断质量预测分数是否小于预设质量分数阈值,若是,则对图像中的文字进行识别,若否,则阻止文字识别,并反馈提示信息;所述提取文字区域的语义特征包括:提取文字区域的多层次全局语义特征;对文字区域进行切块处理,提取每个区域的多层次局部失真特征,并对多层次局部失真特征进行聚合,以得到多尺度局部失真特征;所述提取文字区域的语义特征还包括:A:采用稠密连接网络作为语义特征提取的骨干网络,其中,所述稠密连接网络包括一个卷积和池化层、三个稠密块层二个过渡层以及一个全局平均池化层,三个稠密块层分别为DenseBlock1、DenseBlock2和DenseBlock3;二个过渡层分别为Transition1和Transition2;稠密连接网络的每一层都能够直接访问和利用早期的所有层次内的特征信息,以在使用时将检测出的图像中的文字区域输入稠密连接网络,即可输出多层次全局语义特征;B:整合来自稠密连接网络不同层级的语义特征,并将语义特征进行聚合,得到多尺度局部失真特征,其中,DenseBlock1、DenseBlock2、DenseBlock3的输出分别代表不同层次的抽象特征,覆盖从低级边缘、纹理到高级语义特征的语义特征图,具体地包括以下步骤:B1:将每个DenseBlock1、DenseBlock2、DenseBlock3输出的语义特征图划分为不重叠的固定大小的块,这种划分允许模块聚焦于图像的局部区域,独立分析每个区域内的失真特性;B2:从DenseBlock1、DenseBlock2、DenseBlock3中相应位置提取划分的块并进行拼接,形成一个具有跨尺度信息的特征块,这一步骤利用了跨层特征的互补性,为局部失真分析提供了更全面的信息基础;B3:在每个特征块上应用通道和空间维度上的可学习权重分配;其中,通道注意力机制:首先,针对每个特征块,执行全局平均池化与全局最大池化操作,收集所有空间位置上的信息,将两组池化结果合并并输入到一个共享的多层感知机MLP模型中,通过学习过程生成一个加权向量用来映射各个通道的相对重要性;此加权向量再经过如Sigmoid激活函数的处理,被转换成适于使用的通道注意力权重,并将通道注意力权重用于原特征图,通过逐元素相乘的方式,从而有助于实现依据通道重要性调整特征强度,增强模型对局部失真特征的识别能力;空间维度注意力机制:对每个通道分别应用平均池化和最大池化操作,以获得该通道的全局空间响应;这些响应被送入包含两个连续的3×3的卷积层的卷积网络,以输出与原特征相同尺寸的空间注意力图,然后将空间注意力图与通道注意力权重相结乘,得到每个特征块的每个像素的综合注意力权重,并将综合注意力权重与每个特征块相乘,实现对局部区域中每个像素的精细调校;C:对于经过局部注意力机制调整的每个特征块,使用具有1x1卷积层的卷积网络来调整通道数,恢复其原始尺寸,并与相邻特征块进行融合,以构建完整的多尺度语义特征图,并提取多尺度语义特征,同时对所有特征块进行全局池化操作,提取整个图像的全局上下文信息,并将全局上下文信息与局部多尺度语义特征进行融合,识别出多尺度局部失真特征。

全文数据:

权利要求:

百度查询: 山东浪潮科学研究院有限公司 一种面向文字识别的图像质量自动评估方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。