首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于深度学习的自然场景古汉字识别方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:武汉大学

摘要:本发明提供了一种基于深度学习的自然场景古汉字识别方法及系统。所述方法步骤为,首先构建自然场景古汉字检测与识别数据集,分别用来训练古汉字检测与识别模型,然后检测图像中古汉字的位置,在进行图像校正后识别字符内容。所述系统包括用户终端和云端服务器,二者通信连接;所述用户终端用于获取用户的控制指令,并根据所述控制指令从所述云端服务器调用数据;所述云端服务器包括古汉字检测与识别模块、图像校正模块、文字查询模块、结果反馈模块以及数据存储模块。本方法和系统可以准确地识别自然场景图像中的古汉字,可以辅助阅读古汉字文献和实现古汉字文献的数字化,为古汉字相关的应用提供底层技术支持。

主权项:1.一种基于深度学习的自然场景古汉字识别方法,其特征在于,包括以下步骤:S1:构建自然场景古汉字检测数据集和自然场景古汉字识别数据集;S2:采用自然场景古汉字检测数据集训练DBNet文本检测模型,采用自然场景古汉字识别数据集训练古汉字识别模型;S3:将待检测图像输入到训练后的古汉字检测模型中,输出概率图与自适应阈值图,将两张图逐元素相减,差值图经过可微的近似二值化激活函数fx=11+e-kx得到近似二值图,在该图中提取目标轮廓,并用旋转矩形近似表示;输出所有单个古汉字四边形区域的四个点坐标;S4:根据所述古汉字检测结果,将古汉字图像块从原图像中取出,用透视变换校正为正方形,获取图像校正结果;具体是先用S3所述输出的四个点坐标与预设边长的正方形的四个点计算透视变换矩阵M的参数,公式如下: 然后基于透视变换矩阵将古汉字图像块的形状校正为正方形,公式如下: S5:将校正后的古汉字图像块输入到训练后的古汉字识别模型进行识别,输出字符概率向量,经过softmax函数对文字识别结果归一化后,选取其中概率最高的作为预测结果,最终得到该古汉字对应的简体汉字;所述S1中自然场景古汉字检测数据集通过实地拍摄与网络获取,标签为图像中所有单个古汉字四边形区域的四个点坐标;自然场景古汉字识别数据集包含真实场景图像和由针对自然场景古汉字识别数据集的图像合成方法得到的合成图像,图像合成方法包括以下步骤:S6:获取古汉字图像;S7:获取自然场景纹理图像;S8:随机地对所述古汉字图像进行几何和颜色变换,并且随机地选择所述自然场景纹理图像作为背景,将他们叠加得到合成图像,标签为对应的简体汉字;真实场景图像的获取方式是:通过实地拍摄与网络获取。

全文数据:

权利要求:

百度查询: 武汉大学 一种基于深度学习的自然场景古汉字识别方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。