恭喜北京云上曲率科技有限公司姜孟源获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜北京云上曲率科技有限公司申请的专利一种图像文字语种识别方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114998909B 。
龙图腾网通过国家知识产权局官网在2025-04-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210640881.8,技术领域涉及:G06V30/19;该发明授权一种图像文字语种识别方法及系统是由姜孟源;陈振标;杜晓祥设计研发完成,并于2022-06-08向国家知识产权局提交的专利申请。
本一种图像文字语种识别方法及系统在说明书摘要公布了:一种图像文字语种识别方法与系统,该方法通过对真实场景下的图像文字进行模拟,结合背景图片、字典库、词典库及各语种风格字体库,人工合成带标注的图像文字形成第一训练数据集;对真实场景下的图像文字进行搜集,对搜集的图像文字进行人工分类标注形成第二训练数据集;构建进行OCR语种识别的神经网络CRNN,利用第一训练数据集进行初步训练,得到OCR文字识别模型;采用第一训练数据集和第二训练数据集对OCR文字识别模型进行fine‑tuning,得到OCR语种识别分类模型;利用fine‑tuning后的OCR语种识别分类模型进行模型推理。本发明能得到更好的拟合效果,减少漏检或误伤,提高模型的性能。
本发明授权一种图像文字语种识别方法及系统在权利要求书中公布了:1.一种图像文字语种识别方法,其特征在于,包括:对真实场景下的图像文字进行模拟,模拟过程结合背景图片、字典库、词典库及各语种风格字体库,人工合成带标注的图像文字形成第一训练数据集;对真实场景下的图像文字进行搜集,对搜集的图像文字进行人工分类标注形成第二训练数据集;构建进行OCR语种识别的神经网络CRNN,利用所述第一训练数据集对构建的神经网络CRNN进行初步训练,得到OCR文字识别模型;采用所述第一训练数据集和所述第二训练数据集对所述OCR文字识别模型进行fine-tuning,得到OCR语种识别分类模型;利用fine-tuning后的所述OCR语种识别分类模型进行模型推理;对所述字典库和词典库进行编号,使所有字符对应唯一索引,以指定格式保存作为人工合成图像文字的标签;每个训练样本包括语种级标注信息和文字级标注信息;根据唯一索引形成的文字级标注信息用于所述OCR文字识别模型;语种级标注信息用于fine-tuning所述语种识别分类模型;所述神经网络CRNN包含卷积神经网络CNN和循环神经网络RNN;卷积神经网络CNN采用SE_ResNeXt50_32x4d的骨干部分进行图像语义特征提取,在SE_ResNeXt50_32x4d后接2层Bi-directionalLSTM提取图像文字序列特征;基于CTC_loss采用所述第一训练数据集进行所述OCR文字识别模型训练;对所述OCR文字识别模型进行fine-tuning过程中,将所述第一训练数据集和所述第二训练数据集按照预设分配比例混合成一个训练数据集,采用语种级标注信息,冻结SE_ResNeXt50_32x4d的骨干部分和Bi-directionalLSTM层,将文字识别分类器换成语种识别分类器进行微调;对CNN骨干部分的SE_ResNeXt50_32x4d网络进行修改,保证layer2,layer3和layer4第一次下采样时X轴方向分辨率不变,Y轴保持2倍下采样,即stride=1,2,最终input输入为32*352*channel,backbone输出为1*88*channel,提取的特征图X轴方向变为原图的14,Y轴方向变为原图的132;使用CTC_loss实现公式如下:LSTM给定输入x的情况下,输出为l的概率: 其中π∈B-1l代表所有经过B变换后是l的路径π。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京云上曲率科技有限公司,其通讯地址为:100000 北京市海淀区科学院南路2号1号楼9层913;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。