买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:北京和气聚力教育科技有限公司
摘要:本发明涉及文字识别匹配技术领域,具体涉及一种批量上传数据自动匹配方法及设备,选用三种识别方式依次进行匹配,首先将整体文字识别与多条待匹配条目信息进行对比匹配;之后使用关键字后的区域文字识别结果,计算其与各个待匹配条目信息的最短编辑距离,进行匹配;最后,对手写的区域图像计算字识别概率矩阵,计算其与各个待匹配条目信息的匹配概率。可以理解的是,本发明示出的技术方案,在相对不规范的拍照上传场景和相对较规范的扫描上传场景都适用,且适用各种类型的拍照上传匹配场景。
主权项:1.一种批量上传数据自动匹配方法,其特征在于,包括:S1、获取待上传图像,对所述待上传图像进行旋转矫正,对旋转矫正后的图像的预设区域进行截取,并对截取的预设区域进行整体文字识别;S2、将整体文字识别结果与预先存储的多条待匹配条目信息进行对比,若整体文字识别结果中存在待匹配条目信息,则将所述待上传图像与所述待匹配条目信息进行匹配,否则执行步骤S3;S3、提取整体文字识别结果中预设关键字之后的区域文字识别结果,计算区域文字识别结果与各个待匹配条目信息的最短编辑距离,若最短编辑距离小于预设值,则将所述待上传图像与所述待匹配条目信息进行匹配,否则执行步骤S4;S4、从所述预设区域中截取预设关键字之后的区域图像,对所述区域图像进行单字分割,得到多个手写单字图像;利用提前训练好的手写单字识别模型计算每个手写单字图像的字识别概率矩阵,根据所述字识别概率矩阵计算区域图像的平均概率矩阵;根据平均概率矩阵得到所述区域图像对应各待匹配条目信息的匹配概率,若最大匹配概率大于预设阈值,则将所述待上传图像与所述待匹配条目信息进行匹配;所述字识别概率矩阵,为预设全部字符中每个字符与手写单字图像相似的概率。
全文数据:
权利要求:
百度查询: 北京和气聚力教育科技有限公司 一种批量上传数据自动匹配方法及设备
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。