广州索答信息科技有限公司石忠民获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉广州索答信息科技有限公司申请的专利一种混合手写体与印刷体的光学字符识别方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120976928B 。
龙图腾网通过国家知识产权局官网在2026-04-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511074837.5,技术领域涉及:G06V30/148;该发明授权一种混合手写体与印刷体的光学字符识别方法及系统是由石忠民;秦伟健;林桂石;张焙;杨嘉设计研发完成,并于2025-08-01向国家知识产权局提交的专利申请。
本一种混合手写体与印刷体的光学字符识别方法及系统在说明书摘要公布了:本发明公开一种混合手写体与印刷体的光学字符识别方法及系统,涉及计算机视觉与文档分析技术领域,采用手写体OCR模型优对输入文档图像进行手写体区域检测,并分为印刷体内联手写体、独立手写段落和表格手写体。本发明通过双通道模型架构和细粒度分类策略,解决检测精度低、模型泛化性差的问题,实现高效、轻量化的混合文本解析。改进的YOLOv12‑L模型基于空间布局、书写特征分类,可应对多样化文档场景,减少因场景差异导致的识别失效。通过分类优化,可针对性解决混合场景下的误检、复杂排版的语义断裂及表格干扰等核心问题,实现端到端手写识别的场景自适应。
本发明授权一种混合手写体与印刷体的光学字符识别方法及系统在权利要求书中公布了:1.一种混合手写体与印刷体的光学字符识别方法,其特征在于,包括以下步骤: 步骤1,采用手写体OCR模型优对输入文档图像进行手写体区域检测,并分为印刷体内联手写体、独立手写段落和表格手写体; 步骤2,将所述手写体OCR模型检测的区域,用图片背景色mask,再传输给印刷体OCR模型; 步骤3,印刷体OCR模型输出印刷体文本识别结果; 步骤4,融合印刷体文本识别结果与手写体文本识别结果,按坐标位置拼接生成最终输出文本; 步骤2中,通过手写体Mask机制将检测到的手写体区域替换为背景色,生成掩码后图像,将掩码后图像输入印刷体OCR模型; 手写体Mask机制通过背景色填充消除印刷体干扰,其数学表达为: ; 其中为背景色均值,为原始像素值; 步骤3中印刷体OCR模型调用PP-OCRv4的检测与识别模块,输出印刷体文本识别结果; 改进的YOLOv12引入区域注意力机制,通过空间区域划分降低自注意力的二次复杂度,同时保留大感受野,区域注意力机制复杂度的公式为: ; 其中n为特征图尺寸,k为区域划分数量,d为特征维度,表示区域内像素的局部注意力计算,表示跨区域之间的全局注意力计算,当k<n时,区域注意力机制复杂度从传统的降到; 手写体OCR模型是改进的YOLOv12-L模型,基于手写内容与场景的空间布局、书写特征及模型优化目标的差异性对输入文档图像中手写体进行分类; 针对手写体印刷体内联手写体、独立手写段落和表格手写体三类的差异化检测需求,改进的YOLOv12-L模型采用多任务损失函数,多任务损失函数的表达式为: ; 其中为区域检测损失,侧重表格手写体table_hw的小尺寸字符定位; 为分类损失,区分三类手写体; 为回归损失,针对独立手写段落isolated_hw优化连笔区间的分割边界; 、和分别为任务权重,通过动态调整平衡不同场景的优化目标。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人广州索答信息科技有限公司,其通讯地址为:510000 广东省广州市黄埔区联和街道科丰路262号705房;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励