华南理工大学马千里获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉华南理工大学申请的专利一种基于maskrcnn骨架的自注意力试卷版面分析方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115641433B 。
龙图腾网通过国家知识产权局官网在2025-08-01发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211391142.6,技术领域涉及:G06V10/25;该发明授权一种基于maskrcnn骨架的自注意力试卷版面分析方法是由马千里;冯华文;钟子涵设计研发完成,并于2022-11-08向国家知识产权局提交的专利申请。
本一种基于maskrcnn骨架的自注意力试卷版面分析方法在说明书摘要公布了:本发明公开一种基于maskrcnn骨架的自注意力试卷版面分析方法,用于对试卷的内容按照版面布局进行分析和提取。步骤如下:将图片数据的向量表示输入MaskR‑CNN骨架,提取图片特征,得到Regionfeaturevector局部特征向量和ROI建议框;将Regionfeaturevector和ROI输入自注意力模块中,得到最终用于分类和回归的向量表示;再将该向量表示分别输入给分类全连接层和回归全连接层,分别得到最终的分类结果和回归坐标。该方法基于计算机视觉进行设计,因此完全不受限于输入图片的类型背景明暗、分辨率高低、版面格式、字体颜色等等,适用多个科目。
本发明授权一种基于maskrcnn骨架的自注意力试卷版面分析方法在权利要求书中公布了:1.一种基于maskrcnn骨架的自注意力试卷版面分析方法,其特征在于,所述试卷版面分析方法包括以下步骤: S1、将尺寸为H×W×3的RGB试卷图片输入ResNet-50,得到5张不同尺寸的特征图,分别记作:C1,C2,C3,C4,C5,5张特征图的尺寸依次为其中,H表示试卷图片的高,W表示试卷图片的宽; S2、使用FPN算法对四张特征图C2,C3,C4,C5进行融合,得到通道数相同、尺寸不同的特征图,其中,FPN算法过程为:首先自上而下对C5,C4,C3,C2进行最近邻上采样得到的特征图M5,M4,M3,M2,然后对C5,C4,C3,C2中的每一个特征图进行一个1×1卷积,接着和上采样得到的特征图M5,M4,M3,M2对应进行对应加和得到D5,D4,D3,D2,最后,对加和后的特征图D5,D4,D3,D2进行3×3的卷积最终得到融合特征图P5,P4,P3,P2; S3、对上采样得到的特征图M5进行步长为2的最大池化得到融合特征图P6,该融合特征图P6用于获得后续的候选协议框; S4、分别以融合特征图P6,P5,P4,P3,P2中每一个像素点为中心生成3种不同长度、长宽比分别为1:1,1:2,2:1共9个先验区域,使用区域推荐网络RPN对上述先验区域进行二分类和边框回归,并将属于目标的置信度小于γ的、尺寸过小以至于不能完整包含目标的或尺寸过大以至于超出特征图范围的先验区域过滤掉,其中,γ为用于过滤低置信度先验区域的预定义置信度阈值,接着,采用非极大值抑制过滤重叠的先验区域获得最终的候选区域ROI,其中,每一个矩形候选区域都有四个顶点,ROI∈RN×4,R表示实数域,N是每张特征图的候选框个数; S5、对候选区域ROI进行ROIAlign候选区域对齐,获得大小一致的若干特征图; S6、使用多层神经网络对步骤S5得到的特征图进行边界识别和掩膜预测,其中,边界识别包括区域分类和边界回归; S7、将步骤S4得到的候选区域ROI输入位置编码层Position_Embeddings,获取每个候选区域的位置嵌入特征Position_EmbeddingsROI,其中,Position_EmbeddingsROI∈RN×D,D是预设的局部特征向量的维度; S8、将区域特征向量P与位置嵌入特征Position_EmbeddingsROI相加得到融合向量G,G=P+Position_EmbeddingsROI,对融合向量G进行层归一化操作,得到特征向量F,F=Layer_NormG,其中,G,F∈RN×D,Layer_Norm表示层归一化操作函数; S9、将步骤S8得到的特征向量F输入注意力层得到注意力特征A; S10、将注意力特征A和原始的区域特征向量P相加并进行层归一化操作,得到最终的综合特征向量P′,其中P′∈RN×D; S11、将综合特征向量P′分别输入两个独立的全连接层:第一全连接层FC1和第二全连接层FC2,分别用于分类和边框回归,得到最终的分类和回归结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人华南理工大学,其通讯地址为:510640 广东省广州市天河区五山路381号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。