首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种图片信息结构化方法、装置、设备及介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:平安科技(深圳)有限公司

摘要:本发明涉及人工智能技术领域,提供一种图片信息结构化方法、装置、设备及介质,通过获取待处理图片;采用文本识别网络和文本检测网络对所述待处理图片进行文本检测和识别,以获取检测到的各个文本框的第一最小外接矩形及对应的文字信息;对文本检测网络获取的各所述文本框按照预设顺序进行排序;根据排序结果合并所有文本框的文字信息,以获取所述待处理图片中的文本内容;采用正则规则从所述文本内容中提取目的标签的信息。本发明对比现有技术,在信息提取过程处理速度更快,对服务器系统资源的需求很低,且不需要GPU资源。

主权项:1.一种图片信息结构化方法,其特征在于,包括:获取待处理图片,所述待处理图片为卡证图片或表格文档图片;采用文本识别网络和文本检测网络对所述待处理图片进行文本检测和识别,以获取检测到的各个文本框的第一最小外接矩形及对应的文字信息;根据所述待处理图片的长、宽及所述文本框的第一最小外接矩形的旋转角度构建图像的仿射变化矩阵;根据所述图像的仿射变化矩阵对各所述文本框的第一最小外接矩形进行矫正更新,以获取各所述文本框的第二最小外接矩形;根据各个所述文本框的第二最小外接矩形,按照预设顺序对所有的所述文本框进行排序;根据排序结果合并所有文本框的文字信息,以获取所述待处理图片中的文本内容;采用正则规则从所述文本内容中提取目的标签的信息;其中,采用文本识别网络和文本检测网络对所述待处理图片进行文本检测和识别,以获取检测到的各个文本框的第一最小外接矩形及对应的文字信息,包括:将所述待处理图片输入到所述文本检测网络中进行文本检测,以获取检测到的各个所述文本框的第一最小外接矩形;根据各个所述文本框的第一最小外接矩形,从所述待处理图片中截取各个所述文本框的第一最小外接矩形区域所对应的局部图片;将各个所述文本框的第一最小外接矩形区域所对应的局部图片输入到所述文字识别网络中进行文字识别,以获取各个所述文本框对应的文字信息;根据所述待处理图片的长、宽及所述文本框的第一最小外接矩形的旋转角度构建图像的仿射变化矩阵,包括:选择宽高比大于第一预设值的所有所述文本框的第一最小外接矩形的旋转角度的中位数作为图片旋转角度;以所述待处理图片的长、宽和所述图片旋转角度为参数,构建图像的仿射变化矩阵;根据各个所述文本框的第二最小外接矩形,按照预设顺序对所有的所述文本框进行排序包括:根据各个所述文本框的第二最小外接矩形的中心点纵坐标,按照由小到大的顺序对各个所述文本框进行排序;根据预设规则获取属于同一行的所有所述文本框;根据所述文本框的第二最小外接矩形的顶点横坐标最小值对属于同一行的所有所述文本框进行水平位置排序;其中,判断两个文本框属于同一行的预设规则为:(1)相邻两个所述文本框的第二最小外接矩形的中心点纵坐标差值小于间隔阈值,其中,间隔阈值定义为所有所述文本框的第二最小外接矩形高度的平均值的0.3-0.7倍;2相邻两个所述文本框的第二最小外接矩形的中心点纵坐标差值与中心点横坐标差值的比值,满足;当(1)和(2)同时满足时,则判断两个所述文本框属于同一行。

全文数据:

权利要求:

百度查询: 平安科技(深圳)有限公司 一种图片信息结构化方法、装置、设备及介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。