路由决策模型训练方法、装置、计算机设备及存储介质

导航：龙图腾网> 最新专利技术> 路由决策模型训练方法、装置、计算机设备及存储介质

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：鹏城实验室

摘要：本申请实施例公开一种路由决策模型训练方法、装置、计算机设备及存储介质。在动态网络的多个节点中确定出第一节点，确定第一节点对应的第一网络状态和第一网络动作；将第一网络状态和第一网络动作输入评估子模型中，输出每个第一网络动作的评估值；确定最大的评估值的目标第一网络动作以及目标第一网络动作的第二节点；将第二节点对的第二网络动作、第二网络状态和目标第一网络动作的奖励值输入目标子模型中，输出目标第一网络动作的目标值；根据目标值和最大的评估值确定评估子模型的模型损失，根据模型损失调整评估子模型的模型参数，返回执行在动态网络的多个节点中确定出第一节点，直至模型损失满足预设损失条件，得到训练后的路由决策模型。

主权项：1.一种路由决策模型训练方法，其特征在于，所述路由决策模型包括评估子模型和目标子模型，所述方法包括：在动态网络的多个节点中确定出第一节点，并确定所述第一节点对应的第一网络状态和第一网络动作；将所述第一网络状态和所述第一网络动作输入所述评估子模型中，输出每个所述第一网络动作对应的评估值；确定最大的所述评估值对应的目标第一网络动作以及所述目标第一网络动作对应的第二节点；将所述第二节点对应的第二网络动作、第二网络状态和所述目标第一网络动作对应的奖励值输入所述目标子模型中，输出所述目标第一网络动作对应的目标值；根据所述目标值和最大的所述评估值确定所述评估子模型对应的模型损失，并根据所述模型损失调整所述评估子模型对应的模型参数，返回执行在动态网络的多个节点中确定出第一节点，直至所述模型损失满足预设损失条件，得到训练后的路由决策模型。

全文数据：

权利要求：

百度查询：鹏城实验室路由决策模型训练方法、装置、计算机设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种太阳能光伏智能控制变频水泵装置

下一篇：用于设置在螺旋容器焊接设备中的成型单元

相关技术

一种太阳能光伏智能控制变频水泵装置

用于设置在螺旋容器焊接设备中的成型单元

一种用于碳素生产的布袋除尘装置

一种检测癌症的免疫组化试剂盒

一种可调节径向大小的管道机器人及使用方法

注射成型机的控制装置、注射成型机及注射成型机的控制方法

一种墙体保温工程预制构件及其快速组装方法

一种船舶生产用自动清洁装置

导体迹线结构、转子、转角传感器单元和用于制造转角传感器单元的转子的方法

一种自动化地下管道铺设用微型顶管装置

反向阻断绝缘栅双极晶体管

生活垃圾填埋场内垃圾堆体边坡的绿化结构及施工方法

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

路由决策模型训练方法、装置、计算机设备及存储介质

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务