四川极速动力科技有限公司张小刚获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉四川极速动力科技有限公司申请的专利一种手写中文文本识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120853192B 。
龙图腾网通过国家知识产权局官网在2025-11-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511351788.5,技术领域涉及:G06V30/19;该发明授权一种手写中文文本识别方法是由张小刚;康健;钟剑丹;汤江文;赵越设计研发完成,并于2025-09-22向国家知识产权局提交的专利申请。
本一种手写中文文本识别方法在说明书摘要公布了:本发明公开了一种手写中文文本识别方法,属于图像数据处理领域,包括步骤:获取手写中文数据集D1,其中样本为手写体文本图片,且样本中文字随机部分标注;构造一分割模块;构造一手写中文文本识别网络,包括依次连接的分割模块、识别模块、正则模块;用D1训练手写中文文本识别网络,得到手写中文文本识别模型;获取待识别手写中文文本,经手写中文文本识别模型得到对应的最终文本。本发明构造了一种全新的分割模块,能对未标注的字符也生成定位结果,做到无需人工标注真实框即可生成识别结果,降低了模型实际落地的成本,避免标注大量数据,减少成本,提高工作效率。且本发明能确保语义语境通顺流畅,得到的最终文本准确率高。
本发明授权一种手写中文文本识别方法在权利要求书中公布了:1.一种手写中文文本识别方法,其特征在于,包括以下步骤; S1,获取手写中文数据集D1,其中样本为手写体文本图片,且样本中文字随机部分标注; S2,构造一分割模块,包括S21~S24; S21,获取一目标检测网络M1,包括预训练的ResNet-18和FCN,用于经ResNet-18提取手写体文本的图像特征,经FCN预测手写体文本中每个字符的定位结果,所述定位结果包括预测框和对应的置信度; S22,预设迭代次数T、预设第一阈值θ1、第二阈值θ2,0<θ1<θ2<1,预设集合G; S23,对M1进行训练,其中第t次训练包括Sa1~Sa3,1≤t≤T; Sa1,将样本X输入M1得到每个字符的定位结果,计算定位损失Lloc以最小化Lloc调整M1的网络参数; Sa2,在样本X上生成第t次训练的第一区域R1,t、第二区域R2,t、第三区域R3,t,具体的,将置信度小于θ1的预测框范围构成R1,t、置信度大于θ2的预测框范围构成R3,t、其余预测框范围构成R2,t; Sa3,若t=1,完成本次训练,若t>1,依次更新R2,t内预测框及置信度,对R2,t内一预测框Bt,若更新后的置信度大于θ2,将Bt更新到R3,t; S24,当t=T,迭代结束,剪裁R3,t内预测框得到单字图,存入集合G,并将训练好的目标检测网络M1作为分割模型; S3,构造一手写中文文本识别网络,包括依次连接的分割模块、识别模块、正则模块; 所述识别模块采用FCN,用于输入集合G内单字图,输出预测字符类别,并按定位框的坐标排列为初始文本; 所述正则模块为经MLM任务和NSP任务预训练的BERT模型,用于对初始文本纠错生成最终文本; S4,用D1训练手写中文文本识别网络,每次训练计算分割模块的定位损失、识别模块的分类损失、正则模块的语义损失,三者构成总损失,并以最小化总损失对手写中文文本识别网络进行调整,得到手写中文文本识别模型; S5,获取待识别手写中文文本,经手写中文文本识别模型得到对应的最终文本。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人四川极速动力科技有限公司,其通讯地址为:610000 四川省成都市高新区中和府滨中路85号1层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励