基于奖惩机制和动作策略的加权损失函数更新方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：广东工业大学

摘要：本发明公开了一种基于奖惩机制和动作策略的加权损失函数更新方法。本发明包括以下步骤：定义加权交叉熵损失函数和普通交叉熵损失函数；初始化动作池、动作累积奖励池、动作概率池；设计奖惩机制和动作选择策略；调整加权交叉熵损失函数的权值，实现神经网络训练中加权交叉熵损失函数的动态更新。本发明能够根据神经网络模型每一周期的训练结果，结合奖惩机制和动作选择策略动态更新加权交叉熵损失函数的权值，进行反向传播，灵活更新不同类别的权值，调整模型对不同类别的误分类的敏感度，可以帮助模型更好地适应数据集的特点，从而提高模型的泛化能力和性能。

主权项：1.基于奖惩机制和动作策略的加权损失函数更新方法，其特征在于，根据任务需求对数据进行预处理后，切分提取12导联心跳段序列，并将预处理后提取数据划分训练集和测试集；该方法的目标是对12导联ECG信号进行识别二分类，采用GRU神经网络模型作为分类模型，使用Python中的深度学习框架PyTorch构建GRU神经网络模型；包含如下步骤：步骤一、定义加权交叉熵损失函数和普通交叉熵损失函数；定义加权交叉熵损失函数Jw作为优化算法的目标函数，在训练中进行反向传播，动态调整类权值的目标函数；定义普通交叉熵损失函数J仅用来度量模型拟合效果，求模型的损失值作为度量指标；步骤二、初始化动作池、动作累积奖励池、动作概率池；设计动作池M：定义加权交叉熵损失函数类权值w的变化方向；设计动作累积奖励池PMs：记录各个动作当前的累积奖励值；设计动作概率池Pro：确定每个动作被选取的概率；步骤三、训练模型；对神经网络模型进行训练，前向传播使用普通交叉熵损失函数计算损失值和F1分数，使用加权交叉熵损失函数的损失值进行反向传播，重复训练min_epoch次为一个周期，计算周期平均验证损失值和平均F1分数；步骤四、设计奖惩机制和动作选择策略；根据神经网络模型每轮训练的平均F1分数和平均验证损失值，基于奖励机制计算双重奖励值R，根据双重奖励值R基于动作选择策略更新动作累积奖励池和动作概率池；步骤五：调整加权交叉熵损失函数的类权值；基于更新后动作概率池的概率随机抽取下一个训练周期的动作，调整加权交叉熵损失函数的类权值，实现神经网络训练中加权交叉熵损失函数的动态更新；步骤二具体实现如下:所述设计和初始化动作池M实现如下：M＝[M1,M2,M3,M4,M5]＝[w大减小、w小减少、w不变、w小增加、w大增加]＝[-1、-0.1、+0、+0.1、+1]所述设计和初始化动作累积奖励池RMs如下：RMs＝[R1，R2，…，Ri，…，Rn]；其中，RMs的初始值＝0，R￡是动作Mi的累积奖励值；所述设计和初始化动作概率池Pro：Pro＝[p1，p2，…，pi，…，pn]；其中，pi是动作Mi被选取的概率值，∑pi＝1；步骤四中所述动作选择策略如下：4-1.更新动作累积奖励池RMs：其他动作累积奖励不变，当前训练周期对应动作Mi的累积奖励加上本轮奖惩值，即奖惩机制的双重奖励R，得到更新后的动作累积奖励池R′Ms＝[R1，…，R￡+R，…，Rn]；对更新后该动作的累积奖励R′i进行判断并处理：如果R′i＞SumR′Ms-R′i，则R′i＝SumR′Ms-R′i；4-2.基于更新后的累积奖励池R′Ms，使用softmax分布函数来更新动作的概率，根据各个动作的累积奖励R′i的影响来更新其频率分布，得到新的动作概率池P′ro； P′ro＝[p′1，p′2，…，p′n]其中，p′i是更新后的动作Mi的概率，R′i是动作Mi的累积奖励，β是控制分布的参数，用于调整奖惩对概率的影响程度。

全文数据：

权利要求：

百度查询：广东工业大学基于奖惩机制和动作策略的加权损失函数更新方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种热网加热器换热管泄漏在线定位系统及方法

下一篇：印制电路板、器件焊接检测方法、装置及电子设备

相关技术

一种热网加热器换热管泄漏在线定位系统及方法

印制电路板、器件焊接检测方法、装置及电子设备

ZnO/石墨烯复合材料、Zn杂化石墨烯阻燃环氧丙烯酸酯涂层及制备方法

一种流量计标定装置及标定方法

化合物、有机电致发光元件用材料、有机电致发光元件和电子设备

一种1-溴乙基乙酸酯的制备方法

一种弹性卷材的放卷换卷机构

储能变流器及储能系统

一种稠油工况螺杆泵控制系统

一种线性工程快速出图方法及系统

一种矿山采空区顶板离层测量装置及其测量方法

一种精密铜铝铸件切割装置

加权相关技术

基于高度加权的单波束换能器及控制方法_北京海卓同创科技有限公司_202411426531.7

使用加权矩阵来控制可重配置智能表面_高通股份有限公司_202280094033.X

一种暖通系统冷却侧能耗估计模型加权优化方法与系统_同济大学_202410150199.X

一种优化勘查地球化学数据分析的数学加权方法_中国地质调查局长沙自然资源综合调查中心_202411427344.0

一种基于加权稀疏重构的弱信号DOA估计方法_之江实验室_202411435380.1

基于联盟链的加权访问控制属性基可搜索加密方法_赣南师范大学_202411034162.7

一种基于电流波形加权对比的故障智能定位方法与系统_国网江苏省电力有限公司苏州供电分公司_202410968585.X

用于联合运动矢量差编码模式的基于块的加权因子_腾讯美国有限责任公司_202380014465.X

一种加权信道均衡与载波同步联合的信号恢复方法_北京理工大学_202410983259.6

一种基于灰度加权平均的图像热雾祛除方法_北京航空航天大学_202411075312.9

损失相关技术

基于物联网的智能配电能耗损失评估方法_卓钧电气(河北)有限公司_202410995628.3

一种降低预应力损失的张拉装置及混凝土构件的制备方法_嘉兴欣创混凝土制品有限公司_202411440515.3

用于确定排水泵的压力损失的方法和对此合适的导水式家用器具_BSH家用电器有限公司_202410593591.1

一种肉类蒸煮损失测定装置_中国农业科学院兰州畜牧与兽药研究所_202410987283.7

一种淤地坝系溃决淹没损失严重性综合评价方法_中国水利水电科学研究院_202410965782.6

一种抑制冻品鲜味成分损失的方法及其冰箱_长虹美菱股份有限公司_202411352487.X

一种预应力筋锚口摩阻损失测量装置及方法_中交三航局第三工程有限公司_202311681011.6

用于机器学习模型的分布式训练的损失报告_高通股份有限公司_202280094357.3

一种淤地坝溃决洪水造成的经济损失增长计算方法_中国水利水电科学研究院_202410965781.1

用于在激光雷达系统中以具有减少的信息损失的方式进行数据缩减的方法_罗伯特·博世有限公司_202410581650.3

策略相关技术

里程策略的推荐方法、装置、设备及存储介质_浙江吉利控股集团有限公司_202411044222.3

一种通用防火墙策略采集方法_江西科晨洪兴信息技术有限公司_202411090580.8

策略模型训练方法和装置、动作预测方法和装置、智能体_京东科技控股股份有限公司_202411144637.8

工业互联网信息传播与安全策略防御装置_北京信息科技大学_202310498789.7

一种多储能变流器并联的虚拟同步机控制策略技术_浙江中新电力工程建设有限公司_202410874289.3

CDN加速策略的生成方法、生成装置及电子设备_中国移动通信集团浙江有限公司_202411104723.6

资源配置策略确定方法、装置、设备、存储介质和程序产品_中移物联网有限公司_202411080444.0

一种网络边界安全策略覆盖度的验证方法及装置_北京长亭科技有限公司_202411449134.1

基于引用热度策略的数据分类预测方法与调度方法_国网湖南省电力有限公司_202411228053.9

一种均衡供气策略确定方法、系统、设备及介质_国家石油天然气管网集团有限公司_202410956563.1

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于奖惩机制和动作策略的加权损失函数更新方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务