首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于随机概率加权复合采样策略的暖通空调控制方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:同济大学

摘要:本发明属于暖通空调领域,提出了一种基于随机概率加权复合采样策略的暖通空调控制方法,工作流程下:步骤101,构建并初始化智能体,将初始探索率设为1;步骤102,获取当前暖通空调系统的状态,判断当前探索率是否小于开始采用概率加权采样的设定值;步骤103,使用随机概率加权复合采样策略选择动作;步骤104,执行动作对应的控制指令,更新Q表;步骤105,随训练设定周期减小探索率;步骤106,判断智能体训练是否达到结束标准,若未达到则继续训练,否则将状态参数输入训练好的智能体中。本方法能够有效改善暖通空调系统的性能、降低运行成本、增强系统的稳定性,具有一定应用前景。

主权项:1.一种基于随机概率加权复合采样策略的暖通空调控制方法,其特征在于,工作流程下:步骤101,构建并初始化智能体,确定暖通空调系统的状态空间、动作空间、奖赏函数,状态-动作Q表,将初始探索率设为1;步骤102,获取当前暖通空调系统的状态,判断当前探索率是否小于开始采用概率加权采样的设定值;步骤103,使用随机概率加权复合采样策略选择动作;若当前探索率不小于开始采用概率加权采样的设定值k,判断生成的随机数是否大于当前探索率,当0-1内随机数大于探索率时从状态-动作Q表中选择当前状态Q值最大的动作,当随机数不大于探索率时在动作空间中进行随机动作选择;若当前探索率小于开始采用概率加权采样的设定值k,判断生成的随机数是否大于当前探索率,当随机数大于探索率时从状态-动作Q表中选择当前状态Q值最大的动作;当随机数不大于探索率时,计算历史训练数据中各个动作出现的概率,得到动作空间中各个动作的概率分布,根据概率分布在动作空间中进行动作选择;步骤104,在当前状态下执行动作对应的控制指令,获取暖通空调系统下一状态的状态参数和奖赏反馈,更新Q表;步骤105,随训练设定周期减小探索率;步骤106,判断智能体训练是否达到结束标准,若未达到则回到步骤102继续训练,若达到标准则导出模型,将状态参数输入训练好的智能体中,获取该状态下应下发的控制指令。

全文数据:

权利要求:

百度查询: 同济大学 一种基于随机概率加权复合采样策略的暖通空调控制方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。