买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:安徽安天利信工程管理股份有限公司
摘要:本发明公开了基于OCR技术的图像预处理系统,本发明通过设置客户端模块采集并上传由项目管理人员拍摄预上传的纸质文件的拍摄信息数据,设置初判模块对图像拍摄数据中包含的所有静态字段进行扫描并确定其的质心点坐标,通过图像拍摄数据对应文件类型的模板文件数据中静态字段的质心点坐标,对其进行初步判定,判定通过后由预处理模块对图像拍摄数据中动态对象进行扫描识别,通过这种方式一方面,在不对动态对象进行扫描的前提下基于静态字段对图像进行初步判定,避免了过多次识别动态对象内容可能出现的信息泄露的风险,另一方面,避免了由于拍摄原因造成的图像无法被OCR技术准确识别,导致造成时间上和平台识别处理图像资源的浪费。
主权项:1.基于OCR技术的图像预处理系统,其特征在于,包括:客户端模块,用于项目管理人员拍摄并上传工程项目中纸质文件的图像数据,所述客户端模块提供有拍摄用的焦点区域;项目管理人员通过移动设备按照预设拍摄步骤对预上传纸质文件进行拍摄得到其的拍摄信息数据,所述预上传纸质文件的拍摄信息数据包括有预上传纸质文件的图像拍摄数据和设备姿态数据;初判模块,用于对由项目管理人员拍摄得到的预上传纸质文件的图像拍摄数据进行初步判定,所述初判模块中预存储有各种文件类型对应标准纸质文件的模板文件图像;一种文件类型对应标准纸质文件的模板文件图像是指按照预设拍摄高度和预设拍摄倾斜角度对标准纸质文件进行拍摄得到的图像;所述初判模块接收到客户端模块传输的预上传纸质文件的拍摄信息数据后按照预设初判规则对其进行初步识别判定,依据初步识别判定结果判定生成重拍指令、整理指令还是初判成功指令;所述对预上传纸质文件的拍摄信息数据进行初步识别判定的预设初判规则如下:S11:基于接收到的预上传纸质文件拍摄信息数据中,包含的由项目管理人员选定的文件类型选项对应的文件类型,从初判模块中获取其对应标准纸质文件的模板文件图像,将其标定为初判模板图像;从接收到预上传纸质文件拍摄信息数据中获取其内包含的预上传纸质文件的图像拍摄数据,将其作为待初判图像;S12:获取初判模板图像中包含的所有静态字段,依次标记为A1、A2、...、Aa,a≥1;在待初判图像中将分别与静态字段A1、A2、...、Aa相同的静态字段对应标记为I1、I2、...、Ia;S13:以初判模板图像的左下角为坐标原点,建立第一平面直角坐标系,同样选择水平向右的方向为x轴方向,从原点开始延伸,选择垂直向上的方向为y轴方向,从原点开始延伸;以待初判图像的左下角为坐标原点,建立第二平面直角坐标系,选择水平向右的方向为x轴方向,从原点开始延伸,选择垂直向上的方向为y轴方向,从原点开始延伸;S14:按照预设第一计算规则计算获取静态字段A1的质心点坐标H1f1,g1;S15:按照S14到S15,依次计算获取静态字段A1、A2、...、Aa的质心点坐标H1f1,g1、H2f2,g2、...、Hafa,ga;依次计算获取静态字段I1、I2、...、Ia的质心坐标J1k1,l1、J2k2,l2、...、Jaka,la;S16:基于静态字段A1的质心点坐标H1f1,g1和静态字段I1的质心坐标J1k1,l1,利用公式sinq1=l1-g1k1-f1计算获取静态字段I1相较于A1的平面偏离角q1;获取质心点坐标H1和J1连线形成的线段长度Q1;利用公式计算获取静态字段I1相较于A1的方向评标值R1,所述R为预设标准方向评标阈值,所述ɑ1、ɑ2分别为第一、第二修正因子,所述W1和X1分别为初判模板图像对应的预设拍摄高度和预设拍摄倾斜角度;S17:按照S16依次计算获取静态字段I1相较于A1、I2相较于A2、...、Ia相较于Aa的方向评标值R1、R2、...、Ra;S18:若R1=R2=R3=、...、Ra≠0,则判定待初判图像拍摄不合格,并生成重拍指令,将其传输到客户端模块,由客户端模块提醒项目管理人员进行图像重拍,若R1+R2+...+Ra≠R1且R1+R2+...+Ra≠0,则判定初判图像拍摄不合格,生成整理指令,将其传输到客户端模块,由客户端模块提醒项目管理人员对该预上传纸质文件进行重新整理拍摄;若R1=R2=R3=、...、Ra=0,则判定待初判图像拍摄合格,生成初判成功指令。
全文数据:
权利要求:
百度查询: 安徽安天利信工程管理股份有限公司 基于OCR技术的图像预处理系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。