Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于合成少数类样本的风电机组叶片结冰诊断方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:华北电力大学

摘要:本发明公开了属于风电机组状态预警及故障诊断技术领域的一种基于合成少数类样本的风电机组叶片结冰诊断方法。该方法包括步骤1:监测并记录风电机组的结冰状态,给相应的SCADA数据增加结冰标签,将瞬时特征、原始SCADA数据提取的特征及时序特征结合成最终特征;步骤2:拟合理论功率曲线,采用KBS2合成少数类样本过采样方法形成新的数据集;步骤3:对训练集进行多次迭代,并得出测试集的准确率指标;步骤4:离线训练、在线部署及应用风电机组叶片结冰状态预测模型。本发明能够解决风电机组叶片结冰特征提取及结冰数据占比过低的问题,为风电机组运行维护、状态预警及故障预测研究提供可靠的方法基础。

主权项:1.一种基于合成少数类样本的风电机组叶片结冰诊断方法,其特征在于,所述方法包括:步骤1:监测并记录风电机组的结冰状态,给相应的SCADA数据增加结冰标签,将叶片结冰的瞬时特征、原始SCADA数据提取的特征及叶片结冰时序特征三者结合成最终特征;所述步骤1具体包括如下子步骤:步骤11:选取n台处于结冰期间运行状态良好的风电机组的SCADA数据;步骤12:记录观测期间风电机组的结冰时段及正常时段;步骤13:对监测期间的SCADA数据增加结冰状态标签;步骤14:构建叶片结冰瞬时特征;所述步骤14中的叶片结冰瞬时特征包括:理论功率Ppred:Ppred=fPreal1式1中,Preal为实际功率,f为拟合的多项式函数,Ppred为根据拟合的多项式函数得到的理论功率;风速的平方V2: 式2中,Vin为风速;风速的三次方V3: 叶尖速比λ: 式4中,ω为风电机组叶片旋转角速度,R为叶片半径;结冰严重程度ξ: 步骤15:采用递归特征消除方法,提取出与叶片结冰相关性大的特征,包括发电机转速、环境温度、机舱温度、偏航角度、偏航位置、变桨电机温度;步骤16:设定滑动窗口长度为h,宽度为j,滑动步长为d,采用滑动窗口方法计算连续时间段内步骤14和步骤15提取的每个特征的标准差,得到时序特征;步骤17:将步骤14与步骤15提取的特征合并作为短时特征,将短时特征与时序特征相结合得到最终特征;所述短时特征包括风速、风速的平方、风速的三次方、网侧有功功率、理论功率、叶尖速比、结冰严重程度、发电机转速、环境温度、机舱温度、偏航角度、偏航位置、变桨电机温度;时序特征包括风速的标准差、风速的平方的标准差、风速的三次方的标准差、网侧有功功率的标准差、理论功率的标准差、叶尖速比的标准差、结冰严重程度的标准差、发电机转速的标准差、环境温度的标准差、机舱温度的标准差、偏航角度的标准差、偏航位置的标准差、变桨电机温度的标准差;步骤2:采用四分位法和bin方法拟合理论功率曲线,基于最终特征构建新的数据,采用BorderlineSMOTE-KNN-BorderlineSMOTE合成少数类样本过采样方法形成新的数据集;所述步骤2具体包括如下子步骤:步骤21:将风速分为等间隔的n个区间,采用四分位法进行数据清洗,剔除风速和功率的异常值;步骤22:采用bin方法,计算n个区间内所有数据点风速和功率的平均值;步骤23:根据每个区间内风速和功率的平均值拟合功率曲线及多项式函数,将实际功率代入该多项式函数中得到理论功率;步骤24:根据步骤17得到的最终特征,形成新的数据集;步骤25:将新的数据集的数据按公式6进行最大最小归一化, 式6中:xi为每个特征对应的数据,xmin为每个特征的最小值,xmax为每个特征的最大值;步骤26:对步骤25归一化后的数据集分为包含特征的数据x和结冰标签数据y;步骤27:对步骤26数据中的少数类样本按公式7计算与其最近的b个点的欧氏距离; 式7中:d表示样本x'x1,y1与样本x”x2,y2在二维空间的欧氏距离;根据计算得到的欧氏距离d,确定与少数类样本最近的b个点中多数类样本与少数类样本的数量;对危险少数类样本利用公式7计算该样本附近的c个点,随机选取其中的一个点,利用公式8合成一个新的少数类样本,直至数据集结冰样本与正常样本数量平衡;xnew=x+rand0,1*xneighbor-x8式8中:xnew为合成的新的少数类样本,x为危险少数类样本,rand0,1为0~1间的随机数,xneighbor为被选中的x的一个近邻样本;步骤28:对危险少数类样本重采样过后的数据集代入KNN模型中进行反复训练,将KNN模型诊断为不结冰但实际为结冰的数据样本删除;所述步骤28中的少数类样本分为以下类别:若b个点中,少数类样本数量大于或等于多数类样本数量,则少数类样本属于安全少数类样本;若b个点中,少数类样本数量小于多数类样本数量且少数类样本不为零,则少数类样本属于危险少数类样本;若b个点中,少数类样本数量为零,则少数类样本属于噪声少数类样本;步骤29:对经步骤28得到的数据集重复步骤27的过程,直至数据集中结冰样本与正常样本数量平衡;步骤3:将步骤2形成的新的数据集80%划分为训练集、20%划分为测试集,利用机器学习方法对训练集进行多次迭代以训练风电机组叶片结冰状态预测模型,并得出测试集的准确率指标;步骤4:离线训练风电机组叶片结冰状态预测模型,在线部署及应用风电机组叶片结冰状态预测模型;所述步骤4具体包括如下子步骤:步骤41:设定时间分辨率m分钟,当更新的SCADA数据持续时间超过m分钟时,将更新数据加入到历史数据中,形成新的风电机组数据集;步骤42:对更新的SCADA数据重复步骤2的操作,形成用于训练的新的数据集;步骤43:对经步骤42得到的新的数据集进行步骤3的操作;步骤44:根据步骤43得到训练的模型预测叶片结冰状态,并根据预测的叶片结冰状态发布预警。

全文数据:

权利要求:

百度查询: 华北电力大学 一种基于合成少数类样本的风电机组叶片结冰诊断方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。