一种融合强化学习与递进学习的表情识别方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

摘要：本发明公开了一种融合强化学习与递进学习的表情识别方法，该方法包含：构建包含样本筛选模块与表情分类模块的强化学习模型；将训练集样本划分为I组，使用一组样本对强化学习模型的每一轮训练中，表情分类模块输出预测类别概率，样本筛选模块将样本分为容易、较易、不易分类样本，按照递进学习思想使用容易、较易和不易分类样本对表情分类模块重新训练，根据重新训练前后表情分类模块输出的预测类别概率之差，基于强化学习方法调整样本筛选模块，进入下一轮的模型训练，经过I轮迭代训练得到训练好的表情分类模块；用训练好的表情分类模块对人脸图像进行表情识别。该方法能消除含噪声标签样本对模型训练的不利影响,提升表情识别准确性和鲁棒性。

主权项：1.一种融合强化学习与递进学习的表情识别方法，其特征在于，该方法包括以下步骤：S1：构建包含样本筛选模块与表情分类模块的强化学习模型；S2：将训练集样本划分为I组，在使用一组样本对强化学习模型的每一轮训练中，表情分类模块输出预测类别概率，样本筛选模块将样本分为容易、较易或不易分类样本，按照递进学习思想依次使用容易、较易和不易分类样本对表情分类模块重新训练，根据重新训练前后表情分类模块输出的预测类别概率之差，基于强化学习方法调整样本筛选模块，并进入下一轮的模型训练，经过I轮迭代训练得到训练好的表情分类模块；S3：用训练好的表情分类模块对人脸图像进行表情识别；所述步骤S2包含以下子步骤：步骤2.1：对样本筛选模块、表情分类模块进行随机初始化，利用人脸表情图像库中的所有训练样本对表情分类模块进行初步训练；步骤2.2：将人脸表情图像库中训练集样本划分为I组，每组K个样本，其中样本一共有C个类别；步骤2.3：分别初始化i和k的值为1，设第i组第k个样本为其标签类别为其中，i∈{1，2…I}，k∈{1，2…K}；判断i≤I是否成立，如果成立，则执行步骤2.4，如果不成立，则执行步骤S3；步骤2.4：判断k≤K是否成立，如果成立，则执行步骤2.5，如果不成立，则执行步骤2.8；步骤2.5：将样本输入表情分类模块进行特征提取得到特征向量并输出第c类类别预测概率为得到对应标签类别的预测概率将第i-1组已分类为容易、较易、不易分类样本中容易分类样本的类平均特征向量设为feasy、较易分类的类平均特征向量设为feasier、不易分类样本的类平均特征向量设为fhard；当i＝1时，feasy、feasier、fhard设为全零向量；当i≠1时，将第i-1组已分类为容易、较易、不易分类样本按类别输入表情分类模块进行特征提取，并将提取到的特征向量按照类别计算平均以得到类平均特征向量feasy、feasier、fhard；步骤2.6：获取样本的状态，步骤S2中有关强化学习模型中状态的定义如下：每个表情图像样本都有一个状态它包含当前样本的特征向量还包含feasy、feasier和fhard；则样本的状态为特征向量与各类的平均特征向量feasy、feasier、fhard拼接得到的向量，并将状态输入样本筛选模块；步骤2.7：对样本的状态进行动作选择，步骤S2中有关强化学习模型中动作的定义如下：样本筛选模块的动作是将样本分为容易分类样本、较易分类样本和不易分类样本，设a1表示将样本分为容易分类样本的动作，a2表示将样本分为较易分类样本的动作，a3表示将样本分为不易分类样本的动作，其中，样本筛选模块中Sigmoid分类层输出结果ρ，当ρ≤k1时执行动作a1，当k1＜ρ＜k2时执行动作a2，当k2≤ρ时执行动作a3，其中，ρ∈[0,1]，0＜k1＜k2＜1；则对于样本样本筛选模块执行的动作为样本筛选模块将样本分类为容易分类样本，较易分类样本或不易分类样本，并将样本放入相应样本子集，设样本数据集表示为D∈Rn，将D分为三个样本子集：容易分类样本集Deasy∈Rn，较易分类样本集Deasier∈Rn以及不易分类样本集Dhard∈Rn，其中，D＝Deasy∪Deasier∪Dhard，k++跳转到步骤2.4；步骤2.8：对于第i组中的K个样本的标签类别预测概率计算步骤2.9：采用递进学习的思想，按照先易后难的顺序，分三个阶段循序渐进地对表情分类模块进行重新训练，得到重新训练的表情分类模块；步骤2.10：对样本筛选模块进行奖励，步骤S2中有关强化学习模型中奖励的定义如下：在表情分类模块重新训练之后，将样本输入到表情分类模块，得到标签类别的预测概率令将作为奖励，奖励值越高，则表示样本筛选模块的筛选越正确；利用重新训练后的表情分类模块依次对第i组中的K个样本分别进行类别预测以得到对应标签类别的预测概率根据奖励的定义，计算奖励将一种使用奖励的交叉熵作为损失函数，训练样本筛选模块的参数θ，损失函数为其中，表示输入样本筛选模块时的输出；i++跳转到步骤2.3。

全文数据：

权利要求：

百度查询：南京邮电大学一种融合强化学习与递进学习的表情识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种蒸压轻质加气混凝土砌块生产用成型设备

下一篇：一种采煤机用轴承部件故障监测方法

相关技术

一种蒸压轻质加气混凝土砌块生产用成型设备

一种采煤机用轴承部件故障监测方法

一种高产荆芥内酯重组酿酒酵母工程菌及其优化方法与应用

一种轨道式可拓展智能线形灯

一种用于过滤器焊接的定位夹持装置

一种可调扭矩电动扳手

一种公路桥梁养护用路面修补装置

装修用装饰面板

一种水性环保防腐涂料制备装置及方法

一种高强韧性风电轴承钢及制法、用途和一种风电轴承

一种花卉基质打散混合装置及方法

一种栎树种子采集设备

学习相关技术

深度学习作业优先级调度方法及深度学习作业系统_中国科学院计算技术研究所_202110794626.4

基于均衡选择及对比学习的含噪声标签图像学习方法与系统_江苏开放大学(江苏城市职业学院)_202410281796.6

数据学习服务器和用于生成和使用其学习模型的方法_三星电子株式会社_202411080834.8

一种基于关系学习的异构联邦子图学习方法_电子科技大学_202411013014.7

基于深度学习电力负荷预测方法_深圳渔航科技有限公司_202411155455.0

多智能体强化学习系统_北京卓翼智能科技有限公司_202411476483.2

波束选择中的机器学习_诺基亚技术有限公司_202380033184.9

一种学习开发板_长沙耀迈智能科技有限公司_202323458725.9

基于机器学习的智能转舵_零度新能源科技(广东)有限公司_202411488117.9

压力应对方式判定系统及方法、学习装置及方法、程序及学习完毕模型_广宣社股份有限公司_202080068209.5

递进相关技术

一种多档位递进开口大力钳_宁波日隆星工具实业有限公司_202420697519.9

一种带有递进机构的砂带机_襄阳精楚机械有限公司_202420565487.7

基于智能算法耦合的电力变压器分层递进诊断方法_国网山东省电力公司威海供电公司_202410984756.8

一种多级递进式智能速冻食品加工设备_郴州德庆祥食品有限公司_202411303145.9

一种用于经颅电刺激的递进式脑网络确定方法及装置_北方工业大学_202210080490.5

具有递进式密封结构的加热烟具、加热组件及其使用方法_云南中烟工业有限责任公司_202010435664.6

一种递进输送机构及具有其的分选装置_四维生态科技(浙江)有限公司_202410894068.2

一种融合强化学习与递进学习的表情识别方法_南京邮电大学_202210767298.3

一种级联递进式高精度无线时空频同步方法_中国电子科技集团公司第五十四研究所_202410918333.6

基于分级递进和集体知识的无人机目标检测蒸馏方法_河海大学_202410870827.1

表情相关技术

表情展示方法、装置、电子设备和存储介质_腾讯科技(深圳)有限公司_202110849278.6

一种遮挡表情识别方法、系统、存储介质及电子设备_长春理工大学重庆研究院_202410977385.0

一种基于机器学习的面部抑郁表情识别方法_宁波职业技术学院_202111512514.1

人脸表情识别方法和计算机可读介质_长春大学_202410818719.X

一种基于面部表情识别的自闭症儿童交流障碍辅助方法_金陵科技学院_202111351567.X

一种表情包图片处理方法、装置、设备以及存储介质_西交利物浦大学_202411021440.5

一种基于多模态融合的微表情识别方法_宝鸡文理学院_202411460941.3

一种人脸表情的识别方法及装置_湖南工商大学_202410156471.5

用于驱动数字人的表情系数的生成方法、装置、电子设备及存储介质_北京达佳互联信息技术有限公司_202410931290.5

一种视频流中微表情视频序列的检测方法及装置_中国电子科技集团公司电子科学研究院_202210021817.1

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种融合强化学习与递进学习的表情识别方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务