Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 南京邮电大学余亮获国家专利权

南京邮电大学余亮获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉南京邮电大学申请的专利一种融合预测与学习思想的智慧家庭在线能量管理方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120781716B

龙图腾网通过国家知识产权局官网在2025-11-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511289737.4,技术领域涉及:G06F30/27;该发明授权一种融合预测与学习思想的智慧家庭在线能量管理方法是由余亮;顾家成;陈志强;李杨;岳东设计研发完成,并于2025-09-10向国家知识产权局提交的专利申请。

一种融合预测与学习思想的智慧家庭在线能量管理方法在说明书摘要公布了:本发明公开了一种融合预测与学习思想的智慧家庭在线能量管理方法,包括以下设计步骤:首先,在维持室内热舒适的前提下,建立智慧家庭能量管理系统运行成本最小化问题;其次,将上述问题重新建模为马尔可夫决策过程,并构建智能体以学习与家庭能量管理系统运行相关的隐性世界模型;然后,构建与智能体交互的环境模型;接着,根据构建的环境模型,建立基于模型预测控制与深度强化学习结合的智能体训练框架;训练完成后,智能体基于获得的隐性世界模型进行在线决策,并将决策作用于实际智慧家庭系统。与现有方法相比,本方法结合了模型预测控制与深度强化学习双重优势,可同时降低智慧家庭运行成本并提升室内热舒适性。

本发明授权一种融合预测与学习思想的智慧家庭在线能量管理方法在权利要求书中公布了:1.一种融合预测与学习思想的智慧家庭在线能量管理方法,其特征在于:包括以下步骤: 1在维持室内用户热舒适的前提下,建立智慧家庭能量管理系统运行成本最小化问题,包括目标函数、决策变量及约束条件; 2将运行成本最小化问题重新建模为与家庭能量管理系统运行相关的马尔可夫决策过程,并构建智能体以学习与家庭能量管理系统运行相关的隐性世界模型; 所述步骤2中构建智能体以学习与家庭能量管理系统运行相关的隐性世界模型的智能体包含六个神经网络,即一个编码器网络、一个动态网络、一个奖励网络、一个策略网络、一个值函数网络集合以及一个目标值函数网络集合,上述神经网络均采用深度神经网络结构,由一个输入层、多个隐藏层及一个输出层构成; 具体而言,所述编码器网络,其输入为智慧家庭能量管理系统的状态观测值,输出为低维度的潜在状态编码;所述动态网络,其输入为当前潜在状态、最终执行动作,输出为预测的下一时刻潜在状态;所述奖励网络,其输入为当前潜在状态、最终执行动作,输出为预测的即时奖励;所述策略网络,其输入为当前潜在状态,输出为符合高斯分布的动作均值和对数标准差,用于采样生成初步动作;所述值函数网络集合由多个独立的多层感知机集成构成,每个多层感知机的输入为当前潜在状态、最终执行动作,输出为状态动作值函数值,上述神经网络构成与智慧家庭能量管理系统运行相关的隐性世界模型,其具体公式如下: ; 3构建与学习家庭能量管理系统隐性世界模型的智能体交互的环境模型; 所述步骤3中与学习家庭能量管理系统隐性世界模型的智能体交互的环境模型包括电池储能系统动态模型、室内温度动态模型,上述模型采用白盒建模方式构建;所述环境模型运行所需的数据包括光伏发电功率、智慧家庭刚性负荷、室外温度以及实时电价,上述数据均从智慧家庭能量管理系统的历史运行数据获取; 4根据构建的环境模型,建立基于模型预测控制与深度强化学习结合的智能体训练框架,训练智能体以获得与家庭能量管理系统运行相关的隐性世界模型; 所述步骤4中基于模型预测控制与深度强化学习结合的智能体训练框架具体包含如下步骤: 首先,初始化智能体的神经网络参数、经验回放池以及交互环境模型,然后,设置当前智能体与环境模型交互的时隙数,最后,重复执行预设的迭代步骤直至满足终止条件; 所述步骤4中迭代步骤包括: S51、在时刻,判定当前智能体与环境模型交互的时隙数是否达到预设的最大随机采样生成动作时隙数,若当前时隙数,则进行随机采样获得动作;否则,智能体基于当前环境观测值并采用结合模型预测控制与深度强化学习框架设计的动作规划函数生成最终执行动作; 所述步骤S51中基于模型预测控制与深度强化学习框架设计的动作规划函数具体设计如下: S61、首先,智慧家庭能量管理系统隐性世界模型中的编码器网络读取时刻的状态观测值,并将其映射为一个低维度的潜在状态向量; S62、其次,智慧家庭能量管理系统隐性世界模型调用混合策略生成一个包含个候选动作序列的集合,每个序列的预设长度为,具体而言,智慧家庭能量管理系统隐性世界模型的策略网络首先读取潜在状态向量并进行步前向推演,生成个候选动作序列,接着,基于高斯分布随机采样生成个候选动作序列,其中:和分别表示高斯分布采样中的平均值与标准差; S63、然后,基于迭代式模型预测路径积分优化算法持续优化步骤S62得到的个候选动作序列; S64、最后,完成对个候选动作序列优化后,进行最终迭代的动作序列的输出步骤; S52、智能体将动作执行于构建的交互环境中,获得新的状态观测值和奖励函数,接着,将本次交互产生的经验元组,,,存储至经验回放池中; S53、判定当前交互时隙是否达到智能体中各神经网络模型的更新条件,若达到更新条件,则从经验回放池中采样小批量数据并基于模型预测控制与深度强化学习结合的神经网络更新函数对智能体进行更新; S54、令,并判定当前交互时刻是否达到预设的最大交互时隙数,若当前时刻,则跳转至步骤S51,直至;若当前时刻,则终止训练,获得与智慧家庭能量管理系统运行相关的隐性世界模型; 5训练完成后,基于获得的隐性世界模型进行决策,并将决策作用于实际智慧家庭系统; 所述步骤5中基于获得的隐性世界模型进行决策并将决策作用于实际智慧家庭系统,该过程仅需调用家庭能量管理系统隐性世界模型中的编码器网络和策略网络,即。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京邮电大学,其通讯地址为:210000 江苏省南京市栖霞区文苑路9号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。