Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 广东长实通信科技有限公司易旭良获国家专利权

广东长实通信科技有限公司易旭良获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉广东长实通信科技有限公司申请的专利一种表格图像的单元格区域识别方法、系统及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116778512B

龙图腾网通过国家知识产权局官网在2025-11-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310886946.1,技术领域涉及:G06V30/412;该发明授权一种表格图像的单元格区域识别方法、系统及介质是由易旭良;温炽堂;郑鹏;陈培坚设计研发完成,并于2023-07-18向国家知识产权局提交的专利申请。

一种表格图像的单元格区域识别方法、系统及介质在说明书摘要公布了:本发明提供一种表格图像的单元格区域识别方法、系统及介质,该方法包括:输入文档表格的图像数据;以主干网络捕获文档表格的图像信息,对文档表格的图像信息进行处理,得到多层级的特征信息;借助特征金字塔网络将多层级的特征信息进行融合得到表格图像的内部信息特征;基于低秩分解轴注意力机制对表格图像的内部信息特征进行重整;基于单元格空间位置检测分支网络得到单元格的空间位置;基于单元格逻辑信息分支网络融合表格图像的内部信息特征与空间位置信息进行表格的图网络构建,采用GCN网络预测得出单元格的邻接行列信息;对重整的识别信息在表格图像上进行映射。本发明提升了表格图像的识别精度,能提供更好的特征表示和更好的泛化能力。

本发明授权一种表格图像的单元格区域识别方法、系统及介质在权利要求书中公布了:1.一种表格图像的单元格区域识别方法,其特征在于,包括以下步骤: 步骤S10,输入文档表格的图像数据,设I∈i3×H×W表示输入的表格图像,其中H和W分别表示输入图像的高度和宽度; 步骤S20,以ResNet50为主干网络捕获文档表格的图像信息,对所述文档表格的图像信息进行处理,得到多层级的特征信息; 步骤S30,借助特征金字塔FPN网络将所述多层级的特征信息进行融合得到表格图像的内部信息特征Finter; 步骤S40,基于低秩分解轴注意力机制对所述表格图像的内部信息特征Finter进行重整,增强表征单元格之间的联系; 步骤S50,基于单元格空间位置检测分支网络对表格图像进行行、列和单元格的分割任务得到单元格的空间位置bi; 步骤S60,基于单元格逻辑信息分支网络融合表格图像的内部信息特征Finter与空间位置信息进行表格的图网络构建,采用GCN网络对行列信息进行感知,最后预测得出单元格的邻接行列信息li; 步骤S70,融合表格图像的空间位置信息与逻辑信息后,对重整的识别信息在表格图像上进行映射; 所述步骤S40,基于低秩分解轴注意力机制对所述表格图像的内部信息特征Finter进行重整,增强表征单元格之间的联系的步骤包括: 步骤S401,利用矩阵分解头对ResNet50网络和特征金字塔FPN网络捕获的表格二维信息进行重整,增强表征单元格之间的联系; 步骤S402,采用低秩分解轴注意力对进行表格图像全局信息重整; 所述采用低秩分解轴注意力对进行表格图像全局信息重整的步骤包括: 步骤S403,输入内部特征Finter为规格为[B,C,H,W]的矩阵;在规格重整过程中,将输入张量的通道数C分解为S个通道数为D的小矩阵,然后将每个小矩阵在空间维度上进行展开,形成形状为[B*S,D,N]的小张量,这里的B表示批次中的样本数,C表示输入图像的通道数或特征数,S:表示分解后的通道数或特征数,D表示每个小矩阵中的元素个数,即深度,N表示矩阵的数量,即分解后的矩阵数量,N是由空间维度H和W相乘得到的; 步骤S404,初始化基矩阵bases,大小为[B*S,D,R],其中R表示基矩阵的秩;初始化coef矩阵,coef等于步骤S403得到重整矩阵进行1维、2维变换后与bases矩阵bmm相乘的积,大小为[B*S,N,R]; 步骤S405,在约束次数下,不断进行局部推理过程,得到最终的基矩阵bases和系数矩阵coef,其中约束最大迭代次数为7;局部推理过程如公式1至公式4,其中numerator和denominator张量对应于coef和bases矩阵的更新规则,numerator是输入矩阵X和当前基矩阵base的乘积,denominator是当前权重矩阵coef和转置的当前基矩阵base的乘积; numerator=BMMX,base1 denominator=BMMcoef,BMMtransposebase,base2 步骤S406,将基矩阵bases和系数矩阵coef相乘,得到大小为[B*S,D,N]的矩阵; 步骤S407,将大小为[B*S,D,N]的矩阵重整为大小为[B,C,H,W]的矩阵,得到矩阵分解的结果; 步骤S408,变换为X=[B,C,W,H]矩阵,对X进行行轴卷积得到大小为[B,C,W,1]的加权张量rowatt,X=X×rowatt; 步骤S409,对X进行列轴卷积得到大小为[B,C,1,H]的加权张量colatt,X=X×colatt; 步骤S410,通过1×1卷积重整X后输出,大小为[B,C,W,H]矩阵; 所述步骤S50,基于单元格空间位置检测分支网络对表格图像进行行、列和单元格的分割任务得到单元格的空间位置bi的步骤包括: 基于单元格空间位置检测分支网络使用3×3卷积核进行解码,输入信道从1024个减少到256个; 通过行卷积模块、列卷积模块、单元格卷积模块得到行特征矩阵frow∈i256×H、列特征矩阵fcol∈i256×W和单元格特征矩阵fcell∈i256×H×W,其中,行特征矩阵的规格为[256,图像高],列特征矩阵的规格为[256,图像宽],单元格特征矩阵的规格为[256,图像高,图像宽]; 使用卷积核采样到64,使用1×1的卷积核输出得到预测的分割映射其中,得到尺度规格为[类别,图像高,图像宽],K为预测分类类别:背景、边界、单元格; 映射信息经过所述步骤S70的后处理后输出为表格的分割蒙版图像; 所述步骤S60,基于单元格逻辑信息分支网络融合表格图像的内部信息特征Finter与空间位置信息进行表格的图网络构建,采用GCN网络对行列信息进行感知,最后预测得出单元格的邻接行列信息li的步骤包括: 步骤S601,借助单元格空间位置检测分支网络得到的位置信息作为节点,计算距离形成邻接矩阵,构造整个表格的图G=V,A,其中V为对应单元格,A是节点的邻接矩阵;对于每个单元格或节点Vi,以bi和li分别表示其空间和逻辑的两个关系属性,bi包含了单元格的中心x-y轴位置信息和相对宽和高,li表示推测的单元格的邻接行列关系; 步骤S602,将单元格空间位置检测分支网络提取到的空间特征Vis∈i256和多尺度特征Fdecode进行RoIAlign运算得到卷积特征Fcnn,运算公式为式5;融合单元格空间位置检测分支网络的位置特征Fbox和Fcnn得到融合空间与逻辑连接关系的Ffusion作为后续GCN网络的输入,计算公式为式6; Fcnn=RoIAlignFdecode,Vis5 Ffusion=ConcatFbox,Fcnn6 通过设计行列GCN卷积结合边的权重提取图的行列特征,其中采用的公式为式7和式8,其中,Frow行特征和列特征Fcol为GCN网络感知上一步得到融合特征Ffusion后,在进行Relu激活函数得到的各单元格进行行列分类评估;对可能存在的多个候选中求得预测单元格的邻近行列概率,选择以最大的分数进行某单元格i的邻接行列预测为,开始行结束行开始列结束列 Frow=Relu{GCNrowFfusion}7 Fcol=Relu{GCNcolFfusion}8。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人广东长实通信科技有限公司,其通讯地址为:511510 广东省清远市清城区东城街道长埔社区附城大道78号盈链金科金融信息服务中心5号楼1-3层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。