杭州电子科技大学胡海洋获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉杭州电子科技大学申请的专利一种轻量级移动状态下工业货箱的文本检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114648755B 。
龙图腾网通过国家知识产权局官网在2025-07-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210381339.5,技术领域涉及:G06V20/62;该发明授权一种轻量级移动状态下工业货箱的文本检测方法是由胡海洋;韩俊博;李忠金;厉泽品;翁念标设计研发完成,并于2022-04-12向国家知识产权局提交的专利申请。
本一种轻量级移动状态下工业货箱的文本检测方法在说明书摘要公布了:本发明公开一种轻量级移动状态下工业货箱的文本检测方法。本发明获取生产制造流程中移动状态下搬运货箱的货箱标识牌图像;利用基于双线性特征向量融合的工业货箱文本检测模型对上述货箱标识牌图像实现货箱标识牌上文本信息位置的检测;本发明在ResNet主干网络引入改进的Ghost模块,网络计算量更少;本发明采用双线性特征向量融合模块只需要经过简单的线性操作,就可以完成不同尺度特征向量的融合,因此在不影响实时性的同时,增加了网络检测的精确率;本发明在检测头中采用DB的算法,用动态的自适应阈值代替固定阈值,能更好地汇集周围的环境特征来提高检测精度。
本发明授权一种轻量级移动状态下工业货箱的文本检测方法在权利要求书中公布了:1.一种轻量级移动状态下工业货箱的文本检测方法,其特征在于包括以下步骤: 步骤1、获取生产制造流程中移动状态下搬运货箱的货箱标识牌图像; 步骤2、利用基于双线性特征向量融合的工业货箱文本检测模型对上述货箱标识牌图像实现货箱标识牌上文本信息位置的检测; 所述基于双线性特征向量融合的工业货箱文本检测模型包括Ghost-ResNet骨干网络、双线性特征向量融合模块、特征金字塔增强和特征融合模块、DB语义分割检测头; 所述Ghost-ResNet骨干网络采用现有ResNet网络为基本框架,将现有ResNet网络的每一个基础残差块替换为一个改进的Ghost模块,然后在全连接层后加一个卷积层,最终得到所有通道相等的特征图; 所述改进的Ghost模块采用在现有Ghost模块嵌入特征增强层Squeeze-and-Excitation,实现对现有Ghost模块中第一个部分卷积之后的特征进行重标定,即通过第一个部分卷积获得特征图α,然后对特征图α进行Squeeze-and-Excitation特征增强、线性操作、第二个部分卷积得到特征图β,最后将特征图α和特征图β进行拼接得到最终结果; 所述双线性特征向量融合模块包括依次级联的层化池、特征向量融合模块; 所述层化池用于接收所述Ghost-ResNet骨干网络输出的若干通道相等的特征图,然后将所有特征图大小统一;其中每个特征图包括m个特征向量; 所述特征向量融合模块采用针对当前工厂环境改进的改进LSTM网络,抛弃了现有LSTM中的长期记忆,只保留短期记忆以提高检测效率,用于将所述层化池输出的所有特征图融合; 所述改进LSTM网络具体操作如下: Ft=Conv[ht-1,xt] it=σWi×[ht-1,xt]+bi Ct=tanhWC×[ht-1,xt]+bC 其中Conv为卷积操作,Ct为tanh函数,σ为sigmoid函数,ht为改进LSTM网络对某一特征图中第t个特征向量xt的输出,Wi,bi分别为sigmoid函数的权重和偏置,WC,bC分别为sigmoid函数的权重和偏置,m为特征向量的数量,[ht-1,xt]表示对ht-1和xt的拼接; 所述特征金字塔增强和特征融合模块包括依次级联的特征金字塔增强层FPEM和特征融合层FFM; 所述特征金字塔增强层FPEM接收Ghost-ResNet骨干网络输出的特征图进行级联,产生不同层次的特征F1,F2…Fm,并送入特征融合层FFM; 所述特征融合层FFM接收双线性特征向量融合模块的输出,并利用上采样操作将特征向量扩张为通道数为128、大小为原图14的特征图F;然后将所述特征金字塔增强层FPEM产生的特征F1,F2…Fm进行逐层次融合,再将其与特征图F进行拼接操作获得通道数为5×128,大小为原图14的最终特征图; 所述DB语义分割检测头用于根据所述特征金字塔增强和特征融合模块输出的特征图进行处理,获取包围框; 所述DB语义分割检测头包括卷积层、自适应阈值DB算法层、交运算层、膨胀层; 所述卷积层根据所述特征金字塔增强和特征融合模块输出的特征图,得到概率图; 所述自适应阈值DB算法层采用将现有DB算法中固定阈值更换为自适应阈值; 推理阶段,所述自适应阈值DB算法层通过设置九宫格掩模对概率图进行如下公式自适应阈值计算,获得阈值图; 其中x,y为概率图中的坐标,fx,y是坐标为x,y的像素值,c为自适应阈值算法求得的阈值,px+i,y+j为概率图坐标为x+i,y+j的像素值,f'x,y是阈值图中坐标为x,y的像素; 所述交运算层对概率图和阈值图进行交运算,获取包围框; 所述膨胀层对包围框进行膨胀,膨胀的倍数为D'=A'×r'L',A'为包围框的面积,L'为包围框的周长,r'为膨胀系数; 所述特征增强层Squeeze-and-Excitation包括Squeeze操作,Excitation操作,Reweight操作; 1Squeeze操作,通过空间维度来进行特征压缩,利用全局平均池化操作将每个二维的特征通道变成一个实数,且输出的维度和输入的特征通道数是相同的;其计算公式为: 其中,H,W分别表示特征图的高度和宽度,uci,j为特征图每个通道中坐标为i,j的特征值; 2Excitation操作,引入了循环神经网络中门机制,通过两个全连接操作组成Bottleneck结构,以此建模通道间的相关性;首个全连接层将特征维度降低到输入的116,然后经过ReLu激活后再通过一个全连接层恢复到原来的维度;其计算公式为: sc=Fexzc,W=σgzc,W=σW2δW1zc 其中,zc为Squeeze的输出,W1,W2为权重,δ为ReLu操作; 3Reweight操作,将Excitation的输出的权重看作是经过特征选择后的每个特征通道的重要性,通过乘法逐通道加权到先前的特征上,完成原特征的重标定,公式为: 其中,uc为特征图中的一个通道,sc为Excitation输出的权重;而后再进行残差模块的网络短接操作。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人杭州电子科技大学,其通讯地址为:310018 浙江省杭州市下沙高教园区2号大街;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。