Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于重采样改进的梯度提升树的强电离层闪烁检测方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:东南大学

摘要:基于重采样改进的梯度提升树的强电离层闪烁检测方法,该方法首先提取出GNSS信号中I、Q支路的相关值并计算与其相关的数学表达式作为电离层闪烁检测模型特征向量,采用人工分类将闪烁事件分为弱、中、强三等级并标记。将预处理后的数据集按一定比例分为训练集和测试集,对训练集采用SMOTE‑ENN技术进行重采样得到样本平衡后的数据集,用于XGBoost算法的建模与优化,测试集用于模型性能评估。训练后的分类模型可实现各种闪烁强度下的电离层闪烁事件分类。该方法相对于传统方法在保证整体检测准确率较高的同时,有效提高了强电离层闪烁的识别准确度。

主权项:1.基于重采样改进的梯度提升树的强电离层闪烁检测方法,其特征在于,具体步骤如下:步骤1,从GNSS接收机接收到的信号中提取出I、Q支路的相关值I、Q的均值,计算一段时间内得I2、Q2以及信号强度SI、SI2的均值,再取I、Q、SI的方差σI、σQ、σSI以及I、Q之间的协方差covI2,Q2共计10个参数,组合未检测模型的特征向量,弱、中、强电离层闪烁的类别分别标记为0、1、2,将特征值组成的特征向量和标记值组合为样本矩阵,作为模型训练与测试的数据集;步骤1具体包括:1.1,特征值在分类模型中起着决定性的作用,在跟踪过程结束时,从软件GNSS接收机中提取出I、Q、支路信号以及信号强度SI,将其均值及平方均值一并作为特征元素反映电离层闪烁特性;1.2,考虑到电离层闪烁的非高斯噪声特性,基于上述特征元素,设计了另外4种方差和协方差作为反映电离层闪烁的特征值,表达公式如下: 其中σSI,σI,σQ分别为SI,I和Q的方差,covI2,Q2为I2和Q2的协方差,N是每一特征值中使用的样本数,由σSI,covI2,Q2,σI,σQ补充了特征值集合,最终特征向量表示为:X={I,Q,I2,Q2,SI,SI2,σSI,covI2,Q2,σI,σQ}5I和Q通道的采样频率设置为f=1000Hz,对于每组特征值,设置滑动窗口长度T=60s,即每组样本有N=T·f=60000个初始观测值,设置样本频率为1Hz,滑动窗口步长为1s;1.3S4为衡量电离层闪烁强度的指标,越大则闪烁强度越高,计算各GNSS信号的S4,把0S4≤0.2、0.2S4≤0.6和0.6S4的信号人工标记为闪烁事件L={0,1,2},0、1和2分别对应的弱、中、强闪烁事件;标签:步骤2,为解决训练集中强电离层闪烁事件数相对较少的问题,对步骤A中得到的训练样本进行重采样,首先使用SMOTE过采样技术对样本中的少数类数据进行过采样,所述少数类数据包括强电离层闪烁,即根据少数类样本人工合成新样本加入训练集,再使用ENN欠采样技术对训练样本集中的多数类数据进行欠采样,所述多数类数据包括弱、中程度的电离层闪烁,得到各闪烁事件数相对平衡的新训练集;步骤2具体包括:2.1针对预处理后的训练样本,在相邻的少数类别样本之间进行线性插值,合成新的少数类别样本加入到训练样本中,对于每一个少数类样本xm∈X,m=1,...,M,其中X是少数同类样本的集合,寻找k个最近的同类相邻样本K,然后根据采样率n在K中选择n个样本,将他们标记为ym,i∈Ym,i=1,...,n,m=1,...,M,其中Ym是少数同类样本集合X内每一个xm的k个最近同类样本的集合,最后在xm和ym,1,...,ym,n之间进行随机的线性插值;新的少数类样本表述如下:Xnew,m=xm+r*Ym-xm,m=1,...,M7其中,r为0到1的随机数,Xnew,m是包括由xm建立的n个新样本组成的向量,因此,有M*n个少数类新样本;2.2从2.1中获得新的训练样本集后,再利用ENN方法对该样本集中的多数类样本进行欠采样,即对于某一多数类样本,若三个近邻样本中出现两个及以上不同样本,则删除该样本;2.3将步骤2.2中经过删除一些多数类样本后的训练集输入XGBoost分类器进行训练;步骤3,对经过重采样的训练集进行抽样获得多个子集,采用XGBoost算法训练多个具有相同结构的决策树,每一轮的决策树学习上一轮预测残差并采用二阶泰勒展开近似目标函数,寻找最小化目标函数的回归树并通过设置树的最大深度和样本权重阈值控制树的生长以防止过拟合,将每棵树对应的预测分数相加得样本最终预测结果;步骤3具体包括:3.1初始化第一棵决策树,每一轮的决策树学习上一轮预测残差,从步骤2.3中获取训练集,将训练集划分为多个子集,利用各训练子集初始化一些对应的决策树;3.2在生成树的过程中,寻找合适的回归树最小化包含损失函数和正则项的目标函数,由预测值与真实值之间的差异和正则项组成,表述如下: 其中i表示第i个样本,n表示样本的总数,yi是当前树对样本的打分结果;而是指上一棵树的预测值,ftxi是当前树的新函数;Ωft是对应的正则化项;cons是常数项;3.3对3.2的目标函数在fx处使用泰勒展开后,Objt近似为: 其中T是叶子节点的数量;ωj是第j个叶子节点的权重;γ和λ是正则的惩罚项,用来控制树的复杂度,将和最优解代入公式9,不考虑常数项cons的优化后生成新树的目标函数如下所示: 3.4枚举可能的树结构,计算3.3中的目标函数值,选择值最小树结构,由于树结构种类众多,采用贪心算法列举所有不同的树结构,从深度为0的树开始,对树的每个叶子节点尝试增加分裂节点,实现树分裂后的最大增益,对每个特征,通过特征值进行排序,运用线性扫描寻找特征的最优分裂点,增益表达式如下所示: 其中,GL和GR是树分叉后左右两边叶子节点的一阶梯度值,HL和HR是对应的二阶梯度值,式中前三项分别为左子树分数、右子树分数和不分裂分数,γ是加入新叶子节点引入的复杂度代价,Gain的值决定了该决策树的节点是否继续分裂;3.5当训练完成得到k棵树,根据每棵树每个叶子节点对应的分数相加,得到样本预测值,表达式如下: 其中,fx为其中一棵决策树,ωqx为叶子节点q的分数;3.6将样本预测值经过sigmoid函数,实现电离层闪烁的自动分类,最终预测类别表达式如下:

全文数据:

权利要求:

百度查询: 东南大学 基于重采样改进的梯度提升树的强电离层闪烁检测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。