首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

文字识别方法、装置及设备 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:深圳力维智联技术有限公司;南京中兴力维软件有限公司

摘要:一种文字识别方法、装置及设备,通过获取待识别的单个文字的图片;将图片输入至预先训练好的目标识别模型中,得到待识别的单个文字与文字库中的各个文字的相似度,在对目标识别模型进行训练时,采用相似度损失和分类损失确定目标识别模型是否收敛,相似度损失根据第一字形相似度信息和第二字形相似度信息确定,第一字形相似度信息通过目标识别模型得到,第二字形相似度信息通过预设算法得到,分类损失通过预设分类损失函数得到;将待识别的单个文字确定为最大相似度所对应的文字。由于上述损失函数由通过分类损失和判定两个字之间相似度的相似度损失得到,而相似度损失可以使目标识别模型关注文字的整体结构,从而提高了文字识别的准确度。

主权项:1.一种文字识别方法,其特征在于,所述方法包括:获取待识别的单个文字的图片;将所述图片输入至预先训练好的目标识别模型中,得到所述待识别的单个文字与文字库中的各个文字的相似度;将所述待识别的单个文字确定为最大相似度所对应的文字;其中,训练所述目标识别模型,包括:获取多个样本图片,其中,每个样本图片包括单个文字;将所述每个样本图片输入至初始识别模型中,得到所述每个样本图片包括的单个文字的第一特征向量;通过余弦距离公式,根据所述第一特征向量,计算任意两个所述单个文字的相似度,并对得到的多个相似度进行求和运算,得到第一字形相似度信息;通过预设算法得到第二字形相似度信息,并根据所述第一字形相似度信息和所述第二字形相似度信息,得到相似度损失;其中,所述通过预设算法得到第二字形相似度信息,包括:分别将任意两个样本图片缩放至预设尺寸;分别对缩放后的样本图片进行划分,得到划分为多个格子的样本图片,若样本图片中多个格子内包含非白色的像素,则该格子为1,否则,该格子为0,得到每个样本图片包括的单个文字的第二特征向量;通过余弦距离公式,根据所述第二特征向量,计算任意两个所述单个文字的相似度,并对得到的多个相似度进行求和运算,得到第二字形相似度信息;根据所述相似度损失和分类损失,确定组合损失,其中,所述分类损失通过预设分类损失函数得到;根据所述组合损失,对所述初始识别模型的参数进行调整,以得到更新的识别模型;针对所述更新的识别模型,迭代上述训练过程,直至所述组合损失小于第一预设阈值或者迭代次数大于预设训练迭代次数,并将所述组合损失小于第一预设阈值或者迭代次数大于预设训练迭代次数所对应的识别模型作为所述目标识别模型。

全文数据:

权利要求:

百度查询: 深圳力维智联技术有限公司 南京中兴力维软件有限公司 文字识别方法、装置及设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。