买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:北京捷通华声科技股份有限公司
摘要:本发明实施例提供了固定版面证件结构化信息提取方法、装置、设备及介质。所述方法包括:获取目标证件图像;根据所述目标证件图像的类型选择对应的实例分割模型;通过所述实例分割模型对所述目标证件图像中多个待识别的文本行进行实例分割,获取与所述多个待识别的文本行各自对应的分割实例;通过预设文字识别模型识别所述待识别的文本行的分割实例,获得所述目标证件图像中的结构化信息。使得本发明采用实例分割模型直接定位到待识别的文本行所在位置,然后直接送入预设文字识别模型进行信息识别,不需要对无关文本行进行检测和识别,简化了处理流程,提高了识别准确率和识别速度。
主权项:1.一种固定版面证件结构化信息提取方法,其特征在于,所述方法包括:根据实例分割模型对应的证件类型,获取属于所述证件类型的多个证件的训练样本,并对所述训练样本中各图像的待识别的文本行进行实例分割标注;所述根据实例分割模型对应的证件类型,获取属于所述证件类型的多个证件的训练样本的步骤,包括:对所述训练样本中的各图像进行复制,获得多个复制后的图像;将所述多个复制后的图像进行数据增强,获得多个数据增强后的图像;将所述多个数据增强后的图像加入到所述训练样本中;选择与所述实例分割模型匹配的损失函数和优化器,并将所述损失函数和优化器与所述实例分割模型的输出层连接;其中,不同的实例分割模型匹配不同的损失函数和优化器;通过所述训练样本、所述损失函数和所述优化器对所述实例分割模型进行训练,直到所述实例分割模型的损失收敛结束;获取目标证件图像;根据所述目标证件图像的类型选择对应的实例分割模型;通过所述实例分割模型对所述目标证件图像中多个待识别的文本行进行实例分割,获取与所述多个待识别的文本行各自对应的分割实例;通过预设文字识别模型识别所述待识别的文本行的分割实例,获得所述目标证件图像中的结构化信息;其中,在所述待识别的文本行具有多行的情况下,将所述多个待识别的文本行各自对应的分割实例输入到所述预设文字识别模型中,通过所述预设文字识别模型进行文字识别,并输出所述多个待识别的文本行的识别结果,将所述识别结果进行从上到下的组合,得到完整的文本信息。
全文数据:
权利要求:
百度查询: 北京捷通华声科技股份有限公司 固定版面证件结构化信息提取方法、装置、设备及介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。