北京奇虎科技有限公司郜业飞获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京奇虎科技有限公司申请的专利一种识别场景内中文的识别网络的训练方法和装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN111626287B 。
龙图腾网通过国家知识产权局官网在2025-11-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:201910146791.1,技术领域涉及:G06V20/62;该发明授权一种识别场景内中文的识别网络的训练方法和装置是由郜业飞;董健;颜水成设计研发完成,并于2019-02-27向国家知识产权局提交的专利申请。
本一种识别场景内中文的识别网络的训练方法和装置在说明书摘要公布了:本发明提供了一种识别场景内中文的识别网络的训练方法和装置。该方法包括:利用常用汉字随机地生成第一语料样本;将所述第一语料样本与第一背景图像合成得到含有中文文字区域的第一合成场景图像样本;利用所述第一合成场景图像样本对用于识别场景内中文的识别网络进行训练。由于在随机生成的语料样本中,常用汉字的出现概率是趋向于均匀的,进而在利用基于随机生成的语料样本合成的场景图像样本对识别网络进行训练时,识别网络对所有的常用汉字能够见到的频率也是趋于一致的,从而一定程度上解决了中文文字的长尾分布问题,提升了场景中中文文字的识别效果。
本发明授权一种识别场景内中文的识别网络的训练方法和装置在权利要求书中公布了:1.一种识别场景内中文的识别网络的训练方法,包括: 利用常用汉字随机地生成第一语料样本,其中,在所述第一语料样本中,每个汉字的出现频率被控制为是均等的; 将所述第一语料样本与第一背景图像合成得到含有中文文字区域的第一合成场景图像样本; 利用所述第一合成场景图像样本对用于识别场景内中文的识别网络进行第一阶段训练; 其中,还包括: 获取具有真实语义信息的语料; 将所述具有真实语义信息的语料与第二背景图像合成得到含有中文文字区域的第二合成场景图像样本; 利用所述第二合成场景图像样本对所述识别网络进行第二阶段训练; 其中,还包括: 对真实场景图像进行标注,并裁剪出所述真实场景图像中的中文文字区域; 通过含有中文的真实场景图像的数据集对第二阶段训练后的识别网络的参数进行精调。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京奇虎科技有限公司,其通讯地址为:100088 北京市西城区新街口外大街28号D座112室(德胜园区);或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励