档案数字化处理中的高精度OCR识别与自动纠错方法

导航：龙图腾网> 最新专利技术> 档案数字化处理中的高精度OCR识别与自动纠错方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

摘要：本发明涉及数字化处理技术领域，具体地说，涉及档案数字化处理中的高精度OCR识别与自动纠错方法。其包括如下步骤：对档案文档的文本图像进行预处理，将预处理后的图像文本分割成单独的字符，再利用连通区域分析的方法分离粘连的字符，并从每个字符中提取关键特征；将提取的关键特征与已知的字符模板进行比对，找出最匹配的文本结果；利用基于规则的纠错和基于上下文感知的纠错，对文本结果进行检查和修正。该档案数字化处理中的高精度OCR识别与自动纠错方法能够更好地处理复杂图像，尤其是在图像中存在多个灰度级别的对象时；且能够更好地保护图像中的边缘，防止在腐蚀和膨胀过程中边缘被破坏，同时减少误分割的可能性。

主权项：1.档案数字化处理中的高精度OCR识别与自动纠错方法，其特征在于，包括如下步骤：S1、对档案文档的文本图像进行预处理，在预处理的过程中引入多阈值并结合边缘信息进行优化，将预处理后的图像文本分割成单独的字符，再利用连通区域分析的方法分离粘连的字符，在分离粘连的字符过程中引入加权因子并结合边缘信息进行优化，并从每个字符中提取关键特征；其中，关键特征包括形状特征、笔画特征、几何特征和颜色特征；S2、将提取的关键特征与已知的字符模板进行比对，找出最匹配的文本结果；S3、利用基于规则的纠错和基于上下文感知的纠错，对文本结果进行检查和修正；S4、将检查和修正后的结果保存为指定格式，为档案文档添加元数据信息，并为档案建立用户反馈渠道，收集识别错误的案例。

全文数据：

权利要求：

百度查询：山东省科学院海洋仪器仪表研究所档案数字化处理中的高精度OCR识别与自动纠错方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种提镓树脂中镓钒分步解吸的方法

下一篇：一种冷凝器组装生产平台

相关技术

一种提镓树脂中镓钒分步解吸的方法

一种冷凝器组装生产平台

货厢和车辆

一种烧结台车轮偏移的检测方法、装置、存储介质及设备

一种胺脱氢酶、基因、重组菌、胺脱氢酶粗酶液、脱氢酶组合物、脱氢酶粗酶液组合物和制备(R)-3-氨基丁醇的方法

一种用于过滤器焊接的定位夹持装置

船用发电机干坞临时供水滤器装置及使用方法

一种高强韧性风电轴承钢及制法、用途和一种风电轴承

核桃油指纹图谱构建及掺假鉴别用平台系统

一种主骨切台及收料装置

通信方法、电子设备及存储介质

一种感应器测试验证设备

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

档案数字化处理中的高精度OCR识别与自动纠错方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务