河南工业大学朱春华获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉河南工业大学申请的专利基于注意力调制上下文空间信息的表情识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114758383B 。
龙图腾网通过国家知识产权局官网在2025-08-01发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210317680.4,技术领域涉及:G06V40/16;该发明授权基于注意力调制上下文空间信息的表情识别方法是由朱春华;李雪;周飞;郭歆莹;杨静;杨卫东;许德刚;李智;张闻强;魏蔚;梁义涛;张雪萍设计研发完成,并于2022-03-29向国家知识产权局提交的专利申请。
本基于注意力调制上下文空间信息的表情识别方法在说明书摘要公布了:本发明公开了一种基于注意力调制上下文空间信息的表情识别方法,具体步骤为:S1:获取待训练的自然场景人脸表情图像公共数据集,对人脸表情图像进行预处理;S2:构建用于自然场景人脸表情识别的注意力调制上下文空间信息网络模型;S3:利用预处理过的人脸表情图像对上下文空间信息ACSI网络模型进行训练;S4:重复步骤S3的模型训练,直至达到设定的训练次数,得到训练后的深度残差网络模型,利用训练后的深度残差网络模型进行人脸表情识别。上下文卷积和协调注意力的联合可以显著提高表情识别性能。在公开的表情数据集上,与同类的算法相比,ACSI具有更高的识别性能。
本发明授权基于注意力调制上下文空间信息的表情识别方法在权利要求书中公布了:1.一种基于注意力调制上下文空间信息的表情识别方法,其特征在于,具体包括以下步骤: S1:获取待训练的自然场景人脸表情图像公共数据集,对人脸表情图像进行预处理; S2:构建用于自然场景人脸表情识别的注意力调制上下文空间信息网络模型ACSI; S3:利用预处理过的人脸表情图像对上下文空间信息网络模型ACSI进行训练; S4:重复步骤S3的模型训练,直至达到设定的训练次数,得到训练后的深度残差网络模型,利用训练后的深度残差网络模型进行人脸表情识别; 所述步骤S2具体包括以下步骤: S21:利用上下文卷积块替换残差块的中间卷积层,形成上下文卷积残差模块构建上下文卷积残差网络; S22:使用协调注意力构建协调注意力CA模块对所述步骤S21中构建的上下文卷积残差网络CoResNet提取的多尺度特征分配注意力权重以强化特征表征能力; 所述步骤S21具体为: S211:上下文卷积块接收输入特征图Min,其在不同层级L={1,2,3,...,n}应用具有不同膨胀率的卷积核D={d1,d2,d3,...,dn},即leveli上的卷积核具有膨胀率 S212:在不同上下文卷积的级别level上,上下文卷积均输出多个特征图对于所有i∈L,每个图具有宽度Wout和高度Hout; S213:保持残差结构将层间的相关性结合起来,得到上下文卷积残差模块; S214:根据特征图的尺寸调整每层中上下文卷积块的级别,从而构建上下文卷积残差网络; 所述步骤S21中上下文卷积的可学习参数和浮点运算的数量采用公式1和2进行计算; params=Min·Kw·Kh·Mout1; FLOPs=Min·Kh·Kw·Mout·Wout·Hout2; 其中,Min和Mout表示输入和输出特征映射的数量,Kw和Kh表示卷积核的宽度和高度,最后,Wout和Hout表示输出特征映射的宽度和高度; 所述步骤S22具体为: S221:将CoResNet提取的特征记为X,首先使用尺寸H,1和1,W的平均池化核沿着水平坐标方向和竖直坐标方向对每个通道进行编码,高度为h的第c个通道的编码输出由公式3计算: 该公式3计算水平坐标方向上高度为h时的第c个通道的编码输出,沿宽度i,对输入特征进行求和运算;宽度为w的第c个通道的编码输出由公式4计算: 该公式4计算竖直坐标方向上高度为w时的第c个通道的编码输出,沿高度j,0≤j≤H对输入特征进行求和运算; S222:将步骤S221中的两个变换沿着两个空间方向进行特征聚合,返回一对方向感知注意力图; S223:将步骤S222中生成的一对方向感知注意力图连接起来,将其送入一个1×1的卷积变换函数F中; f=δF[yh,yw]5; 其中,[,]表示沿着空间维度的拼接操作,δ为非线性的sigmoid激活函数,f∈RCr×H+W为水平方向和垂直方向对空间信息进行编码的中间特征映射; S224:继续沿着空间维把f分解成两个单独的张量fh∈RCr×H和fw∈RCr×W,对其使用两个1×1卷积变换Fh和Fw将fh和fw分别变换为相同通道数的张量,采用公式6和7; mh=δFhfh6; mw=δFwfw7; 其中,δ为sigmoid函数,输出的mh和mw作为注意力权值,最后协调注意力模块的输出Z,由公式8所示: 其中zci,j为输出,xci,j为输入,和为注意力权值; 所述步骤S3中的上下文空间信息网络模型ACSI包括依次相连的卷积层、bn层、relu层、Maxpool层、四个上下文残差模块、协调注意力CA模块、全局平均池化层、fc层和Softmax分类层;所述卷积层将输入的人脸表情图像经过3*3标准卷积操作提取特征;bn层对提取的特征进行批量归一化防止梯度消失或爆炸;然后所述relu层对其进行非线性激活;最大池化层用于特征降维;四个上下文卷积模块用于从降维的特征中提取到多尺度的人脸特征;嵌入上下文卷积模块的协调注意力CA模块用于关注不同尺度的特征;所述CoResNet输出特征后的CA模块对输出特征进行注意力加权;全局平均池化层和fc层进行下采样操作,下采样后的人脸表情特征再经过Softmax分类器进行分类。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人河南工业大学,其通讯地址为:450001 河南省郑州市高新技术产业开发区莲花街100号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。