买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明公开了一种基于随机森林的高五卫星上GMI二氧化碳浓度反演方法,包括:利用正向模型获取大气场景下的卫星模拟光谱,构建训练样本集合;利用集成学习算法构建面向训练样本集合的随机森林;利用贝叶斯优化算法优化随机森林,从而构建高五卫星上GMI二氧化碳浓度反演模型;利用反演模型反演高五卫星上GMI二氧化碳浓度。本发明能从训练样中建立大气场景和光谱特征与二氧化碳浓度之间的关系,降低物理模型的计算成本,减少过拟合问题,从而能提高二氧化碳浓度的反演精度。
主权项:1.一种基于随机森林的高五卫星上GMI二氧化碳浓度反演方法,其特征在于,包括步骤:S1.基于地面站点的大气廓线数据,利用正向模型获取不同大气场景下的卫星模拟光谱,从而构建训练样本集合;S1.1利用第i个观测点提供的温度Ti、压强Pi、气溶胶Ai和二氧化碳浓度Ci,建立第i个大气场景ri={Ti,Pi,Ai,Ci},从而得到大气场景集合R={ri|i=1,2,...,n},其中,n表示观测点的数量;S1.2基于高五卫星上GMI光谱范围和光谱分辨率,从正向模型中获取第i个大气场景ri下的卫星模拟光谱si={si,1,si,2,...,si,v,...,si,V},从而得到卫星模拟光谱集合S={si|i=1,2,...,n},其中,si,v表示第i个大气场景ri下的第v个光谱点的辐射光谱数据,V表示辐射光谱点的数量;S1.3根据垂直大气层的压强差和相邻垂直大气层之间的二氧化碳浓度,利用式1计算第i个观测点所在的垂直大气层中二氧化碳的平均柱浓度从而得到二氧化碳平均柱浓度集合 式1中,H表示大气层的垂直高度,P0表示地表压强,Ptop表示垂直大气顶层的压强,Ph表示第h层垂直大气的压强,Ch-1表示第h-1层和第h层垂直大气之间的二氧化碳浓度;S1.4基于大气场景集合R、模拟光谱集合S和二氧化碳平均柱浓度集合Xco2,构建随机森林的训练样本集合T={T1,T2,...,Ti,...,Tn},其中,Ti表示第i个观测点的训练样本,且ri,si表示第i个观测点的特征;S2.利用集成学习算法构建面向训练样本集合T的随机森林;S2.1利用Bootstrap抽样方法从训练样本合集T中抽取若干个训练样本并作为训练样本子集,从而得到k次抽取后的训练样本子集{T′1,T′2,...,T′t,...,T′k},其中,T′t表示第t次抽取的训练样本子集并用于训练第t棵决策树;S2.2从T′t中随机选择部分特征作为特征子集{a1,a2,...,aq,...,aQ},其中,aq表示第q个特征,aq∈ri,si,Q表示特征的数量;利用式2计算第t棵决策树上的节点θ在特征子集上的均方误差 式2中,表示第t棵决策树上节点θ的第q个特征,表示第t棵决策树上节点θ的所有特征的平均值;S2.3利用式3计算第t棵决策树上节点θ的第q个特征的不纯度减少量 式3中,表示第t棵决策树上节点θ的父节点p的特征均方误差,和分别表示第t棵决策树上节点θ的左子节点l和右子节点r的特征均方误差,表示父节点p的样本数量,和分别表示左子节点l和右子节点r的样本数量;S2.4利用式4计算第t棵决策树上节点θ的平均不纯度减少量 将作为第t棵决策树上节点θ的分裂依据,并对所有节点进行分裂从而建立第t棵决策树,进而得到由k棵决策树组成的随机森林;S2.5将训练样本子集{T′t|t=1,2,...,k}分别输入k棵决策树中进行训练,并输出k个二氧化碳平均柱浓度的预测结果{bt|t=1,2,...,k},其中,bt表示第t棵决策树输出的二氧化碳平均柱浓度预测结果,最后将k棵决策树的平均预测结果B作为随机森林输出的预测结果;S3.利用贝叶斯优化算法搜索随机森林的超参数,训练并优化随机森林,以建立高五卫星上GMI二氧化碳浓度反演模型;S3.1构建随机森林的超参数搜索空间,包括:决策树的数量estimators=[e1,e2,...,ej,...,ez]、决策树的最大深度depth=[d1,d2,...,dj,...,dz]、决策树上节点分裂的最大特征数features=[m1,m2,...,mj,...,mz],其中,ej,dj,mj分别表示第j个超参数搜索位置处的决策树数量、决策树最大深度、决策树上节点分裂的最大特征数,z表示超参数搜索空间的大小;将随机森林的超参数搜索空间{estimators,depth,features}作为贝叶斯优化算法的搜索空间X={x1,x2,...,xj...,xz},其中,xj表示第j个搜索位置的一组超参数,且xj=ej,dj,mj;S3.2在训练样本集合T上训练第j个搜索位置的一组超参数xj,并通过式5得到xj的损失函数fxj,从而得到随机森林所有超参数对应的损失函数fx1,fx2,...,fxj,...,fxz; 式5中,和分别表示第i个观测点处二氧化碳平均柱浓度的真实值和预测值;S3.3利用式6得到随机森林的最小损失函数fx,从而得到一组最优的超参数x及其对应的高五卫星上GMI二氧化碳反演模型:fx=argminfx1,fx2,...,fxj,...,fxz6S4.利用反演模型反演高五卫星上GMI二氧化碳浓度;S4.1获取高五卫星上GMI观测光谱DN及其对应观测点的大气场景R′,并通过式7得到高五卫星上GMI观测光谱DN的辐射亮度S′:S′=Gain×DN+Bias7式7中,Gain和Bias分别表示辐射定标系数的增益和偏移量;S4.2将大气场景R′和辐射亮度S′输入高五卫星上GMI二氧化碳浓度反演模型中,从而得到高五卫星上GMI二氧化碳浓度。
全文数据:
权利要求:
百度查询: 安徽大学绿色产业创新研究院 基于随机森林的高五卫星上GMI二氧化碳浓度反演方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。