买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:四川国蓝中天环境科技集团有限公司
摘要:本发明公开了一种基于网格搜索和LGBM的城市河道水质预测方法,涉及城市河道管理技术领域。本发明利用城市河道固定水质监测站点的数据,结合Pearson相关系数和灰色关联度,筛选出与河道固定站点的总磷TP、高锰酸盐CODMN、氨氮NH3N浓度高度相关且自相关程度较低的4个最优特征,利用LGBM水质预测模型对最优特征进行河道水质预测,可有效提升预测结果的准确度,并减少LGBM水质预测模型运算时间;利用网格搜索算法对LGBM水质预测模型进行优化,提高LGBM水质预测模型的精确度,且避免调参过程中的主观性和随意性,具有广泛的适用性和良好的稳健性,克服传统方法过于依赖硬件铺设且无法实时监测水质参数的问题。
主权项:1.一种基于网格搜索和LGBM的城市河道水质预测方法,其特征在于:包括以下步骤:S1、获取待测地区每条河的水质站点监测数据;S2、计算每条河的水质站点监测数据对应的Pearson相关系数和灰色关联度;S3、基于Pearson相关系数和灰色关联度对每条河的水质站点监测数据进行处理,得到对应的最优特征数据;S4、对每条河的最优特征数据进行归一化;S5、构建LGBM水质预测模型;S6、利用网格搜索算法对LGBM水质预测模型进行优化,得到优化后的LGBM水质预测模型;S7、将每条河的归一化后的最优特征数据分别输入至优化后的LGBM水质预测模型,得到对应的水质预测结果,完成对城市河道水质的预测;所述步骤S1包括以下步骤:S1-1、获取待测地区每条河的指标数据;S1-2、利用DBSCAN密度聚类算法对指标数据进行数据聚类,得到聚类结果;S1-3、基于聚类结果,将偏离聚类簇的指标数据作为异常值并进行剔除,得到水质站点监测数据;所述步骤S1-1中的指标数据包括总磷TP、高锰酸盐CODMN、氨氮NH3N、酸碱度PH、电导率CODN、溶解氧DOX、总氮TN;所述步骤S2包括以下步骤:S2-1、分别计算每条河的总磷TP、高锰酸盐CODMN、氨氮NH3N分别与其他指标数据的Pearson相关系数;S2-2、分别计算每条河的总磷TP、高锰酸盐CODMN、氨氮NH3N分别与其他指标数据的灰色关联度;所述步骤S3包括以下步骤:S3-1、计算每条河的每个水质站点监测数据的Pearson相关系数的平均值和灰色关联度的平均值;S3-2、判断是否小于0.5或是否小于0.8;若是则丢弃对应的水质站点监测数据;反之则保留对应的水质站点监测数据,得到初始特征数据;进入步骤S3-3;S3-3、按照或从大到小的顺序,对初始特征数据进行排列,得到排列后的初始特征数据;S3-4、判断排列后的初始特征数据对应的或是否超过0.9;若是则进入步骤S3-5;反之则得到特征数据;S3-5、将或超过0.9对应的排列后的初始特征数据进行筛选,得到筛选后的特征数据;所述最优特征数据包括特征数据和筛选后的特征数据;所述步骤S3-5的筛选的具体过程为:将或超过0.9的对应的两个排列后的初始特征数据作为一组特征数据;针对每一组特征数据,剔除其中任意一个初始特征数据,保留另外一个初始特征数据;筛选后的特征数据包括每组保留的初始特征数据;所述步骤S5中的LGBM水质预测模型采用LightGBM模型,并采用基于梯度的单边采样算法进行训练;其中,LightGBM模型的公式为: 其中,表示水质预测结果,表示求和函数,表示第个归一化后的最优特征数据,表示第个水质预测结果,表示前轮的迭代结果,表示损失函数,表示水质预测结果总数,表示第棵树的水质预测结果,表示第棵树正则化后的水质预测结果;所述步骤S6的具体过程如下:利用网格搜索算法对LightGBM模型的超参数进行优化,通过遍历超参数空间中的所有可能组合,选择具有最优性能的超参数组合;将具有最优性能的超参数组合应用于LightGBM模型,得到优化后的LightGBM模型,即得到优化后的LGBM水质预测模型。
全文数据:
权利要求:
百度查询: 四川国蓝中天环境科技集团有限公司 一种基于网格搜索和LGBM的城市河道水质预测方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。