南京邮电大学卢官明获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南京邮电大学申请的专利一种基于多尺度特征知识蒸馏的动态表情识别方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115331285B 。
龙图腾网通过国家知识产权局官网在2026-03-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210905104.1,技术领域涉及:G06V40/16;该发明授权一种基于多尺度特征知识蒸馏的动态表情识别方法及系统是由卢官明;沈俊强;卢峻禾设计研发完成,并于2022-07-29向国家知识产权局提交的专利申请。
本一种基于多尺度特征知识蒸馏的动态表情识别方法及系统在说明书摘要公布了:本发明公开了一种基于多尺度特征知识蒸馏的动态表情识别方法,该方法包括:对人脸表情视频库中的每个视频进行预处理,生成人脸图像序列样本和光流图像序列样本;构建知识蒸馏框架中的教师‑学生模型;用光流图像序列样本对教师模型进行预训练;构建教师‑学生模型的损失函数,利用预训练后的教师模型对学生模型进行多尺度特征知识蒸馏的训练;用训练好的学生模型作为最终的表情识别模型,对输入视频中人脸进行表情识别。该方法通过引入多层次知识蒸馏,将预训练后的教师模型从光流图像序列中学习到的动态表情特征迁移到学生模型,提升学生模型特征提取能力,增强模型的泛化能力以及对动态表情的鉴别能力,提升动态表情识别的准确率和鲁棒性。
本发明授权一种基于多尺度特征知识蒸馏的动态表情识别方法及系统在权利要求书中公布了:1.一种基于多尺度特征知识蒸馏的动态表情识别方法,其特征在于,该方法包括以下步骤: S1:对人脸表情视频库中的每个视频进行预处理,生成人脸图像序列样本和光流图像序列样本; S2:构建知识蒸馏框架中的教师-学生模型,其中,学生模型和教师模型采用相同的深度神经网络结构; S3:用光流图像序列样本对教师模型进行预训练; S4:构建教师-学生模型的损失函数,利用预训练后的教师模型,使用光流图像序列样本和人脸图像序列样本对学生模型进行多尺度特征知识蒸馏的训练; S5:用训练好的教师-学生模型中的学生模型作为最终的表情识别模型,对输入视频中的人脸进行表情识别; 所述步骤S2中的学生模型和教师模型采用相同的深度神经网络结构,包含顺序连接的第一特征提取模块、第二特征提取模块、第三特征提取模块、第四特征提取模块、全连接层、分类层; 所述步骤S4中构建教师-学生模型的损失函数的具体步骤如下: 4.1在输入光流图像序列样本的教师模型和输入人脸图像序列样本的学生模型的第一特征提取模块之间构建第一特征层蒸馏损失函数,具体方法为:设教师模型和学生模型的第一特征提取模块输出的特征张量分别为其中,下标t代表教师模型,下标s代表学生模型,上标1代表第一特征提取模块,K-1为光流图像序列或人脸图像序列的帧数,C1为第一特征提取模块提取的特征图的通道数,H1和W1分别为第一特征提取模块提取的特征图的高度和宽度,在通道维度上进行全局平均池化操作,分别得到特征张量和定义第一特征层蒸馏损失函数为: 其中,t1i,j,l为特征张量中的一个元素,s1i,j,l为特征张量中的一个元素; 4.2在输入光流图像序列样本的教师模型和输入人脸图像序列样本的学生模型的第二特征提取模块之间构建第二特征层蒸馏损失函数,具体方法为:设教师模型和学生模型的第二特征提取模块输出的特征张量分别为其中,上标2代表第二特征提取模块,K-1为光流图像序列或人脸图像序列的帧数,C2为第二特征提取模块提取的特征图的通道数,H2和W2分别为第二特征提取模块提取的特征图的高度和宽度,在通道维度上进行全局平均池化操作,分别得到特征张量和定义第二特征层蒸馏损失函数为: 其中,t2i,j,l为特征张量中的一个元素,s2i,j,l为特征张量中的一个元素; 4.3在输入光流图像序列样本的教师模型和输入人脸图像序列样本的学生模型的第三特征提取模块之间构建第三特征层蒸馏损失函数,具体方法为:设教师模型和学生模型的第三特征提取模块输出的特征张量分别为其中,上标3代表第三特征提取模块,K-1为光流图像序列或人脸图像序列的帧数,C3为第三特征提取模块提取的特征图的通道数,H3和W3分别为第三特征提取模块提取的特征图的高度和宽度,在通道维度上进行全局平均池化操作,分别得到特征张量和定义第三特征层蒸馏损失函数为: 其中,t3i,j,l为特征张量中的一个元素,s3i,j,l为特征张量中的一个元素; 4.4在输入光流图像序列样本的教师模型和输入人脸图像序列样本的学生模型的第四特征提取模块之间构建第四特征层蒸馏损失函数,具体方法为:设教师模型和学生模型的第四特征提取模块输出的特征张量分别为其中,上标4代表第四特征提取模块,K-1为光流图像序列或人脸图像序列的帧数,C4为第四特征提取模块提取的特征图的通道数,H4和W4分别为第四特征提取模块提取的特征图的高度和宽度,在通道维度上进行全局平均池化操作,分别得到特征张量和定义第四特征层蒸馏损失函数为: 其中,t4i,j,l为特征张量中的一个元素,s4i,j,l为特征张量中的一个元素; 4.5在输入光流图像序列样本的教师模型和输入人脸图像序列样本的学生模型的全连接层之间构建全连接层蒸馏损失函数,具体方法为:定义教师模型和学生模型最后一个全连接层输出的logits特征向量分别为和其中,N为表情类别数,令vt,n、vs,n分别表示向量vt、vs中第n个类别的logit,那么输入样本属于第n个类别的预测概率是由softmax函数估计: 其中,exp·表示以自然常数e为底的指数函数,pt,n、ps,n分别表示教师模型和学生模型对输入样本属于第n个类别的预测概率;对pt,n、ps,n引入蒸馏温度因子T计算软化后的类别预测概率分布,即令: 其中,蒸馏温度T为整数,当T→∞时所有类别具有相同的预测概率,当T→0时软标签成为one-hot编码的标签,即硬标签;利用蒸馏温度T控制每个软标签的重要性,从而在教师模型和学生模型之间进行基于软标签的知识蒸馏,得到学生模型的基于软标签的目标函数,以教师模型获得的软标签所蕴含的暗知识作为监督信息,将知识从教师模型迁移到学生模型; 全连接层蒸馏损失函数使用交叉熵损失函数定义为: 4.6教师-学生模型分类层损失函数使用交叉熵损失函数,定义为: 其中,cn表示真实表情类别标签,当采用one-hot编码时,若真实表情属于第n个类别,则cn=1,否则cn=0,pn表示教师-学生模型分类层将训练样本预测为第n个类别的概率; 4.7教师-学生模型的总损失函数定义为: L=α1L1+α2L2+α3L3+α4L4+βL5+γL6 其中,α1、α2、α3、α4、β、γ是权重参数,α1、α2、α3、α4、β、γ均为正数且α1+α2+α3+α4+β+γ=1。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京邮电大学,其通讯地址为:210003 江苏省南京市鼓楼区新模范马路66号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励