中国科学院大气物理研究所杨婷获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国科学院大气物理研究所申请的专利一种多模态强化学习驱动的PM2.5化学组分垂直廓线反演系统及方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120123697B 。
龙图腾网通过国家知识产权局官网在2025-08-26发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510589239.5,技术领域涉及:G06F18/20;该发明授权一种多模态强化学习驱动的PM2.5化学组分垂直廓线反演系统及方法是由杨婷;王自发;张诗语;李弘毅;宋逸凡;田雨彤;谭怡宁设计研发完成,并于2025-05-08向国家知识产权局提交的专利申请。
本一种多模态强化学习驱动的PM2.5化学组分垂直廓线反演系统及方法在说明书摘要公布了:本发明公开了一种多模态强化学习驱动的PM2.5化学组分垂直廓线反演系统及方法,其中:系统包括深度强化学习模型;深度强化学习模型包括状态空间、Action动作空间、奖励函数、Actor网络和Critic网络;深度强化学习模型用于根据Action动作空间输出的PM2.5各化学组分浓度的垂直廓线预测值与实际监测值间的差异,结合奖励函数,计算当前时刻的奖励值;根据策略评估的评估结果,利用梯度下降方法持续进行策略迭代,直至待深度强化学习模型收敛后,得到最优的目标深度强化学习模型。采用Actor‑Critic网络动态优化策略,结合边缘计算实现分钟级模型更新,解决了传统模型高空盲区、实时性不足等问题。
本发明授权一种多模态强化学习驱动的PM2.5化学组分垂直廓线反演系统及方法在权利要求书中公布了:1.一种多模态强化学习驱动的PM2.5化学组分垂直廓线反演系统,其特征在于,包括多模态数据输入层、数据融合与预处理模块、深度强化学习模型: 所述多模态数据输入层用于获取多模态终端采集的多模态源数据,并对多模态源数据执行预处理以及归一化处理;然后执行Actor-Critic网络参数的初始化网络参数处理操作; 所述数据融合与预处理模块用于执行时空对齐处理以及去噪处理;在时空对齐处理时,首先执行空间对齐,采用克里金插值将卫星遥感数据匹配至激光雷达垂直网格,然后利用动态时间规整算法衡量长度不同的时间序列的相似度,对齐地面监测站的时间序列;在执行去噪处理时,对激光雷达光学参数应用小波阈值去噪得到去噪后的数据; 所述深度强化学习模型用于根据Action动作空间输出的PM2.5各化学组分浓度的垂直廓线预测值与实际监测值间的差异,结合奖励函数,计算当前时刻的奖励值;然后对当前策略进行策略评估得到评估结果;然后根据策略评估的评估结果,基于策略梯度方法计算Actor网络的梯度包括:将得到的归一化后的多模态数据的当前状态张量;将多模态输入数据进行转化输出归一化的动作张量;Actor网络执行前向传播,利用多层Transformer编码器,通过自注意力机制捕捉并整合跨高度层的长程依赖,输出对应PM2.5各化学组分浓度垂直廓线的预测值;并通过Critic网络执行前向传播:输入相同的状态张量给基于GCN的Critic网络,得到当前状态对应的状态价值;在执行奖励评估时,根据输出的PM2.5各化学组分浓度的垂直廓线预测值与实际监测值之间的差异,结合奖励函数,计算当前时刻的奖励值;利用Critic网络输出的状态价值和实际采集到的奖励,计算两者之间误差得到优势函数;在更新所述Actor网络时,使用所述优势函数来计算当前Actor网络的梯度;利用梯度下降方法持续进行策略迭代,直至待所述深度强化学习模型收敛后,得到对应的Actor-Critic网络参数以及输出得到最优的目标深度强化学习模型; 所述奖励函数为: ; 其中,α、β为权重系数,Temporal_Inconsistency为惩罚相邻时间步预测结果的突变,为垂直廓线预测值与实际监测值之间的均方根误差。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国科学院大气物理研究所,其通讯地址为:100020 北京市朝阳区北辰西路81号院;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。