买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:南昌航空大学
摘要:本发明公开了一种轻量级文档版面分析方法,步骤如下:采集并标注第一文档图像,得到的表示版面基元相对位置及类别的第一标签,将第一文档图像和第一标签组合为第一图像标签对,并加入第一文档版面分析数据集;对第一文档版面分析数据集进行预处理,得到第二文档版面分析数据集,并将第二文档版面分析数据集划分为训练集、验证集和测试集;设计第一文档版面分析模型结构;初始化模型参数,用第二文档版面分析数据集训练第一文档版面分析模型,得到第二文档版面分析模型;输入待测图像至第二文档版面分析模型进行分析,输出版面基元识别结果。本发明的优势在于,在保证检测精度的同时,实现了文档版面分析模型结构的轻量化,具有检测速度快的特点。
主权项:1.一种轻量级文档版面分析方法,其特征在于:该方法包括以下步骤:步骤S1;构建文档版面分析数据集:采集第一文档图像,并对第一文档图像进行标注,得到表示版面基元的相对位置与类别的第一标签,将第一文档图像和第一标签进行组合,得到第一图像标签对,将第一图像标签对加入第一文档版面分析数据集S1;步骤S2;文档版面分析数据集预处理:对第一文档版面分析数据集S1进行预处理,得到第二文档版面分析数据集S2,并设置划分数量比例t,将第二文档版面分析数据集S2按照划分数量比例t划分为训练集train、验证集val和测试集test;步骤S3;设计文档版面分析模型:设计文档版面分析模型的结构,获得第一文档版面分析模型M;步骤S4;训练文档版面分析模型:初始化文档版面分析模型各项参数设置,使用第二文档版面分析数据集S2对第一文档版面分析模型M进行训练,获得第二文档版面分析模型Mt;步骤S5;识别版面基元:读取待测试真实图像,将待测试真实图像输入第二文档版面分析模型Mt中进行分析,获取版面基元的识别结果;所述步骤S1中采集第一文档图像,具体步骤如下:步骤S11,使用相机拍摄纸质文档或使用扫描仪扫描纸质文档,得到第一文档图像;所述步骤S2中对第一文档版面分析数据集S1进行预处理,得到第二文档版面分析数据集S2,具体步骤如下:步骤S21,配置输入图像尺寸,将输入图像高度设置为h,输入图像宽度设置为w;步骤S22,遍历第一文档版面分析数据集S1中的每一个图像标签对;步骤S221,令Ii表示当前遍历的第i个图像标签对中的第i个第一图像,令si表示当前遍历的第i个图像标签对中的第一标签,其中i=1,2,…,n,n为第一文档版面分析数据集S1的图像标签对数量;步骤S222,将当前遍历的第i个图像标签对中的第一图像Ii的每个像素值除以255,将像素值的范围从[0,255]转换到[0,1],将当前遍历的第i个图像标签对中的第一图像Ii的图像高度调整为h、图像宽度调整为w,得到第二图像Iri;步骤S223,将第二图像Iri与当前遍历的第i个图像标签对中的第一标签si组合生成第二图像标签对,将第二图像标签对加入到第二文档版面分析数据集S2;步骤S3的文档版面分析模型,采用神经网络结构包含如下组件:九个卷积模块、四个文档特征提取模块、一个快速空间金字塔池化层、二个最近邻插值上采样层、四个拼接层、四个文档特征融合模块和三个预测头,将以上组件按照序列连接,构成前向传播路径;具体为:步骤S31,第一卷积模块接收经过预处理的第二图像Iri,第一卷积模块的输出连接第二卷积模块的输入;第二卷积模块的输出连接第一文档特征提取模块的输入,第一文档特征提取模块的输出连接第三卷积模块的输入;第三卷积模块的输出连接第二文档特征提取模块的输入,第二文档特征提取模块的输出连接第四卷积模块的输入;第四卷积模块的输出连接第三文档特征提取模块的输入,第三文档特征提取模块的输出连接第五卷积模块的输入;第五卷积模块的输出连接第四文档特征提取模块的输入,第四文档特征提取模块的输出连接快速空间金字塔池化层的输入;步骤S32,快速空间金字塔池化层的输出连接第六卷积模块的输入,第六卷积模块的输出连接第一最近邻插值上采样层的输入;第一最近邻插值上采样层的输出和第三文档特征提取模块的输出同时连接第一拼接层的输入,第一拼接层的输出连接第一文档特征融合模块的输入;第一文档特征融合模块的输出连接第七卷积模块的输入,第七卷积模块的输出连接第二最近邻插值上采样层的输入;第二最近邻插值上采样层的输出和第二文档特征提取模块的输出同时连接第二拼接层的输入,第二拼接层的输出连接第二文档特征融合模块的输入;步骤S33,第二文档特征融合模块的输出同时连接第八卷积模块和第一预测头,第八卷积模块的输出和第七卷积模块的输出同时连接第三拼接层;第三拼接层的输出连接第三文档特征融合模块,第三文档特征融合模块的输出同时连接第九卷积模块和第二预测头;第九卷积模块的输出和第六卷积模块的输出同时连接第四拼接层,第四拼接层的输出连接第四文档特征融合模块;第四文档特征融合模块的输出连接第三预测头;步骤S3中的九个卷积模块的任一卷积模块,包括一个卷积层、一个批归一化层和一个激活函数SiLU;卷积模块的连接顺序如下:卷积模块的输入连接第一卷积层的输入,第一卷积层的输出连接第一批归一化层的输入;第一批归一化层的输出连接第一激活函数SiLU的输入,第一激活函数SiLU的输出即为卷积模块的输出;步骤S3中的四个文档特征提取模块的任一文档特征提取模块,包括三个卷积模块、二个卷积层、二个激活函数ReLU、二个深度可分离卷积层、二个批归一化层和一个拼接层;具体为:文档特征提取模块的输入连接第十卷积模块的输入,第十卷积模块的输出同时连接第十一卷积模块的输入和第二卷积层的输入,第二卷积层的输出连接第一激活函数ReLU的输入,第一激活函数ReLU的输出同时连接第一深度可分离卷积层的输入和第二批归一化层的输入,第一深度可分离卷积层的输出和第二批归一化层的输出进行相加后输入第二激活函数ReLU的输入,第二激活函数ReLU的输出连接第三卷积层的输入,第三卷积层的输出同时连接第二深度可分离卷积层的输入和第三批归一化层的输入,第十卷积模块的输出、第二深度可分离卷积层的输出和第三批归一化层的输出进行相加后的输出和第十一卷积模块的输出同时连接第五拼接层的输入,第五拼接层的输出连接第十二卷积模块,第十二卷积模块的输出即为文档特征提取模块的输出;步骤S3中四个文档特征融合模块的任一文档特征融合模块,包括三个卷积模块、二个卷积层、二个批归一化层、一个激活函数LeakyReLU、一个激活函数ReLU和一个拼接层;具体为:文档特征融合模块的输入连接第十三卷积模块的输入,第十三卷积模块的输出同时连接第十四卷积模块的输入和第四卷积层的输入,第四卷积层的输出连接第四批归一化层的输入,第四批归一化层的输出连接第一激活函数LeakyReLU,第一激活函数LeakyReLU的输出连接第五卷积层的输入,第五卷积层的输出连接第五批归一化层的输入,第五批归一化层的输出连接第三激活函数ReLU的输入,第三激活函数ReLU的输出和第十四卷积模块的输出同时连接第六拼接层的输入,第六拼接层的输出连接第十五卷积模块,第十五卷积模块的输出即为文档特征融合模块的输出。
全文数据:
权利要求:
百度查询: 南昌航空大学 一种轻量级文档版面分析方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。