恭喜江南大学杨金龙获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜江南大学申请的专利基于注意力机制优化的HRNet人体姿态识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114419732B 。
龙图腾网通过国家知识产权局官网在2025-03-28发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210036567.9,技术领域涉及:G06V40/20;该发明授权基于注意力机制优化的HRNet人体姿态识别方法是由杨金龙;冯雨;刘佳;张媛;刘建军设计研发完成,并于2022-01-11向国家知识产权局提交的专利申请。
本基于注意力机制优化的HRNet人体姿态识别方法在说明书摘要公布了:本发明公开了基于注意力机制优化的HRNet人体姿态识别方法,属于人体姿态识别,深度学习处理领域。所述方法首先在不同分辨率特征图跨通道融合过程中加入扩张卷积,在不产生额外的参数和计算量的情况下能够在不改变低分辨率特征图的尺寸下增加感受野,确保做出决策时没有忽略重要信息;其次提出新的特征融合的策略,通过引入通道注意力机制对不同分辨率的特征图进行加权融合,通过自适应地重新校准特征映射的另一个方向,以增强有意义的特征,同时抑制弱特征,加快了收敛速度,优化了人体姿态识别性能,并且在检测精度上有了进一步提升。
本发明授权基于注意力机制优化的HRNet人体姿态识别方法在权利要求书中公布了:1.一种基于优化HRNet网络的人体姿态识别方法,其特征在于,所述方法包括:步骤一:获取视频流;步骤二:所述优化的HRNet网络模块获取视频流中的待识别人体姿态图片,将图片输入到原分辨率的通道得到高分辨率子网特征图,即为第一阶段的输出特征图;步骤三:对所述高分辨率特征图进行下采样,得到分辨率为原来的12倍的低分辨率子网特征图,采样的过程中采用扩张卷积增大感受野;步骤四:引入注意力机制对所述步骤三得到的不同分辨率子网特征图进行跨分辨率特征融合,对每个通道的特征图进行全局平均池化后收缩空间维度得到对应的权重值,得到带权特征图,即为第二阶段的输出特征图;步骤五:将步骤四得到的带权特征图作为下一阶段的输入,重复步骤二至步骤四,直到输出第四阶段的输出特征图;步骤六:根据所述第四阶段的输出特征图得到最终的人体姿态识别结果;所述步骤四的计算过程包括:对于所述扩张卷积得到的特征图统一上采样或下采样,得到了同一个分辨率的特征图后进行融合,特征图融合策略采用通道注意力模型,引入压缩激励模块SE对每个通道的特征图进行全局平均池化后收缩空间维度得到对应的权重值;所述SE模块通过加权的方式进行跨通道特征融合,当第n-1阶段到第n阶段进行跨分辨率交互时,b表示融合输入所属分支序列号,r表示融合后所属分支的序列号,DownHnrt和UpperHnrt分别表示对特征图Hnr进行t次的下采样和上采样,那么新融合得到的分支结果公式如下:fnrHn-1r=Hn-1rb=rfnrHn-1r=DownHn-1rr-bbrfnrHn-1r=UpperHn-1rb-rbr所述SE模块后把每一个Hnr作为输入X,X=[x1,x2,……,xC′],其中xC′表示第C′个通道的特征图集合;对于每一个映射输入X∈RH′×W′×C′到特征映射U∈RH×W×C′都会分别计算其特征对应的权重;其中,Hnr是第n阶段第r分支的特征图,fnr*代表第n阶段第r分支的采样操作,H’、W’、C’分别是输入的原特征图的高,宽,通道数,H、W分别是所述SE模块输出特征图的高和宽;Ftr为一个卷积算子,对应网络层中的conv2D操作,使用V=[v1,v2,……,vc]表示学习到的滤波器核集,其中vc表示第c个滤波器的参数集,最终所述SE模块输出的特征图用U=[u1,u2,……,uc]表示,其中: 其中,uc为第c个通道的经过所述SE模块输出的特征图,uc∈RH×W,是一个二维空间核,代表作用于输入X的相应通道的单一信道;所述带权特征图的计算过程包括:在得到跨通道特征图之后,通过对卷积的到的特征图进行处理,得到一个和通道数一样的一维向量作为每个通道的评价分数,然后将该分数分别施加到对应的通道上,得到其结果;首先通过全局池化将全局空间信息压缩到一个信道描述符中;每个通道的特征图都具有一个局部接受域,因此输出后的特征图U的每个单元都无法利用该区域之外的上下文信息;通过压缩特征图U的空间维度得到特征图的权重值集z,其中z的第c个元素计算方法为: 其中,Fsq表示对图像进行压缩,uci,j中i和j就是对输出特征图的高和宽的累加的下标;在输入特征图后由全局池化得到一个一维向量也就是每个通道对应的权重,并且把全局池化后的一维向量视为具有全局感受野,在激励的环节中通过自适应重新校准获取通道级依赖关系;因此经过Sigmoid激活函数和一种简单的门控机制满足:Sigmoid=Fexz,W=σgz,W=σW2δW1z其中,δ为ReLU函数、Fex表示激活操作;为了限制模型的复杂性和帮助泛化,在经过两个全连接层后,其中先是还原比为l的降维层,经过一个ReLU函数后再进行增维,然后返回到转换输出特征图U的通道维数,最终输出的带权特征图为:Gc=Fscaleuc,sc=scuc其中,G=[G1,G2,……,GC],Sc表示经过帮助模型复杂和泛化运算后的权重值,Fscaleuc,sc是sc和特征映射uc∈RH×W之间的通道级乘法,也就是和原特征图对应位置相乘,最终得到了带权特征图。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人江南大学,其通讯地址为:214122 江苏省无锡市滨湖区蠡湖大道1800号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。