恭喜华南理工大学唐国志获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜华南理工大学申请的专利基于布局关联性的视觉富文档信息抽取方法、系统及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114782965B 。
龙图腾网通过国家知识产权局官网在2025-04-04发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210223134.4,技术领域涉及:G06V30/40;该发明授权基于布局关联性的视觉富文档信息抽取方法、系统及介质是由唐国志;薛洋;金连文设计研发完成,并于2022-03-07向国家知识产权局提交的专利申请。
本基于布局关联性的视觉富文档信息抽取方法、系统及介质在说明书摘要公布了:本发明公开了一种基于布局关联性的视觉富文档信息抽取方法、系统及介质,其中方法包括:获取视觉富文档图像,并对视觉富文档图像进行标注,获得数据集;构建针对布局关联性的文档信息抽取模型,采用数据集对文档信息抽取模型进行训练;获取视觉富文档图片,将视觉富文档图片输入训练后的文档信息抽取模型,获得信息抽取结果;其中,布局关联性指的是静态字段和动态字段之间的位置关系,静态字段为同一模板中文字固定的字段,动态字段为同一模板中根据实际内容变化的字段。本发明提供了一种利用文档布局关联性的视觉富文档信息抽取的方案,这种方案可在在小样本数据下即可实现高精度的视觉富文档信息抽取任务,可广泛应用于视觉信息抽取领域。
本发明授权基于布局关联性的视觉富文档信息抽取方法、系统及介质在权利要求书中公布了:1.一种基于布局关联性的视觉富文档信息抽取方法,其特征在于,包括以下步骤:获取视觉富文档图像,并对视觉富文档图像进行标注,获得数据集;所述视觉富文档图像包括车票图像、发票图像、证书图像以及证件图像;构建针对布局关联性的文档信息抽取模型,采用数据集对文档信息抽取模型进行训练;获取视觉富文档图片,将视觉富文档图片输入训练后的文档信息抽取模型,获得信息抽取结果;其中,布局关联性指的是静态字段和动态字段之间的位置关系,静态字段为同一模板中文字固定的字段,动态字段为同一模板中根据实际内容变化的字段;所述文档信息抽取模型的训练过程,包括:将字段中不同的语义表示为一个1024维的嵌入向量,将字段的位置特征量化为数字,将处理好的语义和位置特征输入作为输入特征;对预设模型中每个类别计算这个类别里面所有输入特征的均值,作为每个类别的类别中心;通过衡量样本与类别中心的距离来完成分类;所述文档信息抽取模型对输入的视觉富文档图片进行如下处理:获取视觉富文档图片中每个独立的字段,作为图中的节点;获取节点之间的边连接关系;其中,边连接关系为{|Xi-j|,|Yi-j|,WiWj,HiHj},|Xi-j|表示两个字段节点在横坐标上的距离,|Yi-j|表示两个字段节点在纵坐标上的距离,WiWj表示两个字段节点对应的两个矩形框的宽的比值,HiHj表示两个字段节点对应的两个矩形框的高的比值;获取所有的静态字段和动态字段之间连接关系,根据连接关系获取静态字段和动态字段之间的匹配关系;所述匹配关系通过以下方式获得:获取预设字段和所有字段之间的匹配概率值;选取匹配概率值大于阈值的匹配关系表示两个字段之间的一种匹配关系;所述匹配关系包括一对一的匹配关系、一对多的匹配关系以及多对一的匹配关系;当出现一对多的匹配关系以及多对一的匹配关系时,根据概率值获取最优的概率匹配。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人华南理工大学,其通讯地址为:510641 广东省广州市天河区五山路381号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。