买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:国家海洋环境预报中心
摘要:本发明涉及海洋观测数据技术领域,具体涉及一种基于单分类器的风、浪要素数据质量控制方法,包括风、浪要素传感器和浮标,所述浮标和风、浪要素传感器测得风、浪的观测数据,将其与风‑浪作用不变量理论曲线进行比对,通过两者之间的曲线偏离度判断数据的质量。本方法以风‑浪作用不变量理论为基本理论依据,通过单分类器算法由计算机模拟风‑浪作用关系并判断数据的质量,在已验数据的应用中可由数据用户指出异常数据即人工订正,并将人工订正后的数据通过本方法迭代训练获得新的质量控制模型,从而提升质量控制的准确性。
主权项:1.一种基于单分类器的风、浪要素数据质量控制方法,包括风、浪要素传感器和浮标,其特征在于:所述浮标和风、浪要素传感器测得风、浪的观测数据,将其与风-浪作用不变量理论曲线进行比对,通过两者之间的曲线偏离度判断数据的质量,其中,海面风和浪之间通过观测资料表明其存在以下不变性关系: 其中和分别为无因次波高和周期,α为经验系数,具体为0.062;其中g、Hs和U*分别为重力加速度、有效波高和摩擦风速;其中Ts为有效周期;海-气界面过程处于局地平衡态,具备良好的不变性,上述不变性关系为正常风、浪的数据点分布位置,即观测的风、浪数据点应均匀紧密的分布在该理论曲线附近,反之则违背了风-浪不变性关系,可以判定其为异常值,由于我国实际风速观测中少有摩擦风速U*数据,而多为10米高风速U10的数据,且h米高风速Uh与U*呈非线性正相关关系,可写为:U*=fh·Uh2其中h为风速观测高度,而式2中的正相关关系会因各测点地理因素不同而不同,因此,式1中的α会随着风速观测高度和测点地理情况不同而不同,令α=gh,即有: 将指定观测点历史风-浪数据对数化、无因次化,在训练阶段,以单分类模型代替理论曲线,设在N维空间中的超球面,半径为R,球心为a,该空间中的样本点为{xi,i=1,2,…,M},我们可以得到:xi-axi-aT≤R24由于我们要使超球面的半径最小,因此由4式得到:FR,a=R25并使其半径最小;引入拉格朗日算子,构建一个拉格朗日函数: 其中的拉格朗日算子αi≥0,对6式进行求偏导,并令其导数为0,可以得到以下条件: 将7、8带入6中可以得到: 至此,我们可以通过二次规划算法得到最优的αi使9式最小,在此种情况下,待验数据点较多时将会对空间区域描述的性能带来较大损失,因此,我们引入松弛因子εi,将4式更改为:xi-axi-aT≤R2+εiεi≥010引入一个常数C作为惩罚系数,可以控制超球面发生误接受与误拒绝的概率: 构建拉格朗日函数: 对其求偏导,并令导数为0,可得: 0≤αi≤C13将13代回12中,可得: 通过二次规划算法得到最优的αi使上式最小,以满足半径最小的目的,从而得到质量控制模型;在质量控制时,将经过对数化、无因次化的待验数据Z以及质控模型通过下式进行检测: 若待验数据满足上式时接受该数据,否则质疑该数据,从而生成已验数据,之后可对已验数据进行人工纠错,并将最后获得的模型更新,利用更新之后的模型对后续待验数据进行质量控制;所述不变性关系的理论基础上通过单分类器算法即可有效判别风、浪要素观测数据中的异常值。
全文数据:
权利要求:
百度查询: 国家海洋环境预报中心 一种基于单分类器的风、浪要素数据质量控制方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。