广州启辰电子科技有限公司周家齐获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉广州启辰电子科技有限公司申请的专利面向题库建设的高效文档版面分析方法、系统、设备及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119992579B 。
龙图腾网通过国家知识产权局官网在2025-09-23发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510113074.4,技术领域涉及:G06V30/413;该发明授权面向题库建设的高效文档版面分析方法、系统、设备及介质是由周家齐;龚梦帅;马震远;马千里设计研发完成,并于2025-01-23向国家知识产权局提交的专利申请。
本面向题库建设的高效文档版面分析方法、系统、设备及介质在说明书摘要公布了:本发明公开了一种面向题库建设的高效文档版面分析方法、系统、设备及介质,适用于题库建设,分析方法步骤如下:扫描不同学科试卷、教材配套习题、书籍的文档图像,并预处理得到无倾斜的扫描文档图像;标注扫描文档图像中各元素的相对位置和类别标签得到文档数据集;采用文档数据集对文档版面目标检测模型进行训练;将待检测的图像输入到经过训练的文档版面目标检测模型中,检测包括题目、图形和表格在内的前景内容,并输出版面元素的识别结果。本发明在提升前景内容检测精度的同时,提高了文档版面目标检测模型的推理速度,实现了对不同学科试卷和教材习题中的各类元素的准确识别,为题库建设等应用提供了高效的解决方案。
本发明授权面向题库建设的高效文档版面分析方法、系统、设备及介质在权利要求书中公布了:1.一种面向题库建设的高效文档版面分析方法,其特征在于,所述高效文档版面分析方法包括以下步骤: S1、扫描不同学科试卷、教材配套习题、书籍的文档图像,并预处理得到无倾斜的扫描文档图像; S2、标注扫描文档图像中题目和图表的相对位置及类别标签,得到文档数据集; S3、采用文档数据集进行训练得到文档版面目标检测模型;所述文档版面目标检测模型包括依次顺序连接的轻量级特征提取网络、特征编码器和检测头; 所述轻量级特征提取网络包括主干路径、分支路径和动态多尺度融合模块,其中,主干路径和分支路径分别从输入图像中提取浅层特征,浅层特征包括边缘特征、纹理特征、颜色特征;动态多尺度融合模块通过动态融合策略对来自主干路径和分支路径的浅层特征进行多尺度信息整合得到最终融合的特征图X; 所述特征编码器包括依次顺序连接的多尺度信息交互模块和双卷积注意力模块,多尺度信息交互模块包含8层多头注意力,用于捕获特征图中不同频率的信息关系,双卷积注意力模块包含2个卷积和2个注意力机制,用于同时建模全局特征和局部特征,去除文档图像噪声;把特征编码器记作函数G,定义如下:其中特征图X具有c个输入通道,为输出特征图,表示经过多尺度信息交互模块和双卷积注意力模块处理后的特征表示;所述检测头对输出特征图进行特征不确定性最小查询选择操作,计算定位预测分布P与分类预测分布C之间的差异,公式如下: 其中,为特征编码器的输出特征图,表示输入图像经过特征编码器处理后的特征表示,,D表示特征的维度,表示特征编码器特征在定位任务中的预测分布,表示特征编码器特征在分类任务中的预测分布,符号“”表示求2范数,是特征不确定性,定义为定位预测分布和分类预测分布之间的差异,反映查询特征的不确定性,表示文档版面目标检测模型对输入数据的预测结果,表示输入数据的真实标签,包括真实类别和真实边界框,表示模型在定位任务中的输出边界框,表示输入数据的真实边界框,表示模型在分类任务中的输出类别,表示输入数据的真实类别标签,表示预测边界框和真实边界框之间的差异,表示预测类别和真实类别之间的差异,定义如下: 其中,表示边界框的中心坐标,分别表示边界框的宽度和高度,表示边界框参数的索引,表示当误差的绝对值小于1时,损失为误差的平方的一半,当误差的绝对值大于或等于1时,损失为误差的绝对值减去0.5,表示类别标签参数的索引,是类别数;S4、将待检测的图像输入到经过训练的文档版面目标检测模型中,检测包括题目、图形和表格在内的前景内容,并输出版面元素的识别结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人广州启辰电子科技有限公司,其通讯地址为:510663 广东省广州市黄埔区科汇四街1号201房;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。