首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

使用双分支空洞内容卷积模块的文档图像表格检测方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:国泰基金管理有限公司

摘要:本发明公开了一种使用双分支空洞内容卷积模块的文档图像表格检测方法,本发明可以根据用户提供的文档图像,并且此文档图像存在图形和表格等多种信息,或者包含形状布局等各异的表格区域,此方法使用带有双分支空洞内容卷积模块的Transformer架构对表格区域进行检测,并输出用户所需要的xml文件等结果。

主权项:1.使用双分支空洞内容卷积模块的文档图像表格检测方法,其特征在于,包含如下:第1步:将预处理后的图片输入表格检测网络,该表格检测网络为Transformer骨干网络;第1.1步:导入网络所需要的Transformer骨干网络预训练权重;第1.2步:将图片划分为不重叠的图像块经过线性投影再特征展平;第2.1步:将第1.2步处理好的特征,经过已经加载了预训练Transformer骨干网络块,选择Transformer的{3,5,7,11}层进行输出,得到不同尺度的特征C2至C5;第2.2步:对于第2.1步得到高维度特征C5会通过双分支空洞内容卷积模块,经过的上分支使用不同膨胀率的密集连接空洞卷积,经过的下分支同归一化后通过带有空洞卷积大核卷积注意力层和随机丢弃后,双分支特征组合得到输出的双分支内容信息;第2.3步:将第2.2步输出的的双分支内容信息,送入到自注意力模块,并还将第2.1步得到的高维度特征C5经过1*1卷积通道与上分支内容信息,送入到交叉注意力模块,最后将两模块的特征进行相加,最后得到最终的特征P5输出;第2.4步:将第2.1步和第2.3步得到的不同尺度的特征,送入特征融合模块,该特征融合模块先进行尺寸的统一,然后经过由3*3卷积层、归一化层和RELU激活函数组成的卷积块,再经过由多个卷积组成的残差层,得到多尺度特征融合后的P4至P2输出;第2.5步:经过第2.3步和第2.4步的多尺度特征融合后,得到特征P5-P2进行组合,送入级联区域网络,进行检测框的预测,从而利用第1步的图片完成检测模型的训练,然后利用检测模型进行,最后生成检测结果。

全文数据:

权利要求:

百度查询: 国泰基金管理有限公司 使用双分支空洞内容卷积模块的文档图像表格检测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。