杭州网易智企科技有限公司杜彬彬获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉杭州网易智企科技有限公司申请的专利文本识别方法、介质、装置和计算设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114021557B 。
龙图腾网通过国家知识产权局官网在2026-03-20发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111323474.6,技术领域涉及:G06F40/279;该发明授权文本识别方法、介质、装置和计算设备是由杜彬彬;邓芮;李雨珂;杨卫强;朱浩齐;周森设计研发完成,并于2021-11-08向国家知识产权局提交的专利申请。
本文本识别方法、介质、装置和计算设备在说明书摘要公布了:本公开的实施方式提供了一种文本识别方法、介质、装置和计算设备,该方法包括:获取待识别数据;通过目标文本识别模型,获取待识别字符的字符特征,目标文本识别模型是基于样本数据中样本字符的样本字符特征进行训练得到的;根据待识别字符的字符特征,确定待识别字符对应的文本;根据待识别字符对应的文本,确定待识别数据对应的目标文本。本方案中,通过字符特征与预设码本获得字符对应的文本,可以剔除目标文本识别模型中常规的分类层,且采用的预设码本的参数量相对较小,可以在够保证文本识别结果的准确性的同时,降低目标文本识别模型的包体大小,使得目标文本识别模型可以灵活的应用于各种计算设备。
本发明授权文本识别方法、介质、装置和计算设备在权利要求书中公布了:1.一种文本识别方法,包括: 获取待识别数据,所述待识别数据对应多个待识别字符; 通过目标文本识别模型,获取所述待识别字符的字符特征,所述目标文本识别模型是基于样本数据中样本字符的样本字符特征进行训练得到的,所述样本字符中包括所述待识别字符;所述目标文本识别模型通过以下方式训练得到:获取多个样本数据,所述样本数据对应多个样本字符;在第i次训练过程中,通过第i-1文本识别模型获取所述样本字符的样本字符特征,所述第i-1文本识别模型是基于样本字符的样本字符特征进行训练得到的,i为大于1的整数;根据各所述样本字符的状态特征,确定所述样本字符中的空符;获取所述样本数据中预设数量的目标空符的样本字符特征;根据非空符字符对应的样本字符特征、所述目标空符的样本字符特征和预设码本,确定所述第i-1文本识别模型对应损失函数值,所述损失函数值用于指示样本字符特征和预设码本的之间的距离;响应于所述损失函数值满足预设要求,输出所述第i-1文本识别模型为目标文本识别模型; 根据所述待识别字符的字符特征和预设码本,确定所述待识别字符对应的文本;所述预设码本包括空符对应的预设码本以及重复字符对应的预设码本; 根据所述待识别字符对应的文本,确定所述待识别数据对应的目标文本; 所述根据所述待识别字符的字符特征和预设码本,确定所述待识别字符对应的文本,包括: 根据所述待识别字符的字符特征与预设码本的之间的相似度,确定所述预设码本中对应于所述待识别字符的目标码本; 根据所述预设码本与预设状态特征的对应关系,确定所述目标码本对应的目标状态;不同的目标状态对应于不同的字符类型,所述字符类型包括空符和重复字符; 根据所述待识别字符的目标状态,确定所述待识别字符的字符类型; 确定所述待识别数据中除空符和重复字符之外的字符为目标字符; 根据所述目标字符的目标码本,确定所述目标字符对应的文本。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人杭州网易智企科技有限公司,其通讯地址为:310052 浙江省杭州市滨江区长河街道网商路399号3幢408室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励