Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 广东工业大学曾安获国家专利权

广东工业大学曾安获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉广东工业大学申请的专利一种基于深度强化学习的供应链资源控制优化方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119784292B

龙图腾网通过国家知识产权局官网在2025-10-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411900442.1,技术领域涉及:G06Q10/087;该发明授权一种基于深度强化学习的供应链资源控制优化方法是由曾安;陈峥嵘;朱清华;姬玉柱;杨宝瑶;潘丹;吴恒设计研发完成,并于2024-12-23向国家知识产权局提交的专利申请。

一种基于深度强化学习的供应链资源控制优化方法在说明书摘要公布了:本发明涉及供应链技术领域,公开了一种基于深度强化学习的供应链资源控制优化方法,包括:构建多阶段供应链环境;构建动作分解的软演员‑评论家智能体;使用所述多阶段供应链环境训练所述软演员‑评论家智能体,获得训练好的软演员‑评论家智能体;将所述训练好的软演员‑评论家智能体部署到目标供应链,输出最佳动作决策。本发明针对如需求波动、复杂的结构、高维的状态与动作空间以及复杂的奖励函数等问题,提出了一种基于深度强化学习智能体,该智能体通过使用特征提取模块和动作分解机制,使其能够通过分析历史生产订单需求和缺货记录来预测未来的市场趋势,并且基于实时的供应链库存数据,智能体能够动态地调整库存管理策略,有效应对供应链资源协同控制优化中的多种问题,有效减少库存积压和缺货风险,还提高供应链的响应速度和灵活性,最终实现整体运营效率的显著提升。

本发明授权一种基于深度强化学习的供应链资源控制优化方法在权利要求书中公布了:1.一种基于深度强化学习的供应链资源控制优化方法,其特征在于,所述方法包括以下步骤: 构建多阶段供应链环境; 构建动作分解的软演员-评论家智能体; 使用所述多阶段供应链环境训练所述软演员-评论家智能体,获得训练好的软演员-评论家智能体,所述动作分解的软演员-评论家智能体包括状态特征密集网络、动作特征密集网络、软演员网络、两个软评论家主网络和两个软评论家目标网络,所述状态特征密集网络用于提取所述多阶段供应链环境中状态对应的的特征,记为第一特征;所述软演员网络用于根据所述第一特征决策动作;所述动作特征密集网络用于根据所述动作提取决策动作的特征,记为第二特征;所述软评论家主网络用于根据所述第一特征和所述第二特征计算当前时刻t的Q值;所述软评论家目标网络用于计算下一时刻t+1的Q值,所述Q值表示在当前状态下选择某个动作后,可以获得的未来累积奖励的期望值; 将所述训练好的软演员-评论家智能体部署到目标供应链,输出最佳动作决策。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人广东工业大学,其通讯地址为:510080 广东省广州市越秀区东风东路729号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。