Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于KNN算法的河流幸福等级评估方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

摘要:本发明公开了一种基于KNN算法的河流幸福等级评估方法,包括:构建候选特征库,通过主成分分析法和Pearson相关性得出河流幸福等级的核心特征;对样本特征数据进行归一化处理,确定模型参数并构造KNN模型,其中k值采用交叉验证法选取,距离量度采用欧式距离;将待评估河流的特征数据作为测试数据集代入模型,得到该河流幸福等级;本发明不仅能克服现有技术中主观分析法出现评分差距过大的情况,客观分析法中数据误差大的状况,还能解决特征选取不全面、未考虑人水之间关系等不足,本方法评估得到的数据准确率高。

主权项:1.一种基于KNN算法的河流幸福等级评估方法,其特征在于,包括如下步骤:1确定评价河流幸福等级的四个特征准则层,构建出特征候选库,通过主成分分析法和Pearson相关性分析确定核心特征;步骤1具体包括:11选取河流安全、水量充足、河流健康、人水和谐四个准则层下共29个特征构成候选特征库;29个特征为:居民人均可支配收入、建成区绿地覆盖率、城市防洪排涝达标率、堤防达标率、洪涝损失占GDP比例、洪涝人口受灾率、水利工程设施完好率、水土流失程度;集中式饮用水水源地达标率、人均水资源量、用水普及率、供水保证率、灌溉水利用系数、产水模数、污水集中处理率、河湖富营养化状况、生态基流满足水平、鱼类保有指数、控制断面水质达标率、水功能区水质达标率、水生生物完整性指数;万元工业增加值用水量、水文化挖掘和保护水平、公众对河流治理的满意度、水生态文明公众认知比例、万元工业产值用水量、水法律法规建设程度、景观多样性指数和水能资源开发利用率;12结合软件Canoco5.0进行主成分分析PCA以及软件Spss24.0进行Pearson相关性分析筛选核心特征,得到15个核心特征;15个核心特征包括:居民人均可支配收入、建成区绿地覆盖率、城市防洪排涝达标率、堤防达标率、集中式饮用水水源地达标率、人均水资源量、用水普及率、污水集中处理率、河湖富营养化状况、生态基流满足水平、鱼类保有指数、万元工业增加值用水量、水文化挖掘和保护水平、公众对河流治理的满意度和水生态文明公众认知比例;2对核心特征进行归一化处理,数据预处理后构造KNN模型,其中k值采用交叉验证法选取,距离量度采用欧式距离;步骤2具体包括:21采用模糊隶属度函数对指标进行无量纲处理;指标分为正向特征和负向特征,正向特征表示该特征对河流幸福是正向影响,负向特征表示该特征对河流幸福是负向影响,计算公式为: 其中Ai、Bj为各特征归一化之后的结果,且Ai、Bj∈[0,1],Mi,mi分别表示经过筛选分析后确定为各指标的最优值和最差值的界限;22采用欧式距离,设特征空间χ是对于n维实数向量空间Rn,zi,zj∈χ,zizj之间的欧式距离为: 其中L2zi,zj表示zizj之间的欧式距离,n表示特征数量;23采用交叉验证的方式选取k值,数据集随机分为k个包,每次将其中一个包作为测试集,剩下k-1个包作为训练集进行训练;最后计算k次求得的分类率的平均值,作为真实分类率;24根据欧氏距离计算测试点与数据集中各点之间的距离,并将距离按递增次序排序,找出与测试点最相近的k个样本点,并将这k个样本点所表示的集合记为N_kx;25使用KNN分类器模型预测标签,预测的目标是使分类误差平均代价最小,计算公式为: 其中表示被预测的类别;K表示类别的数量;表示在已知观察值x已知的条件下其为第h类的后验概率;Cy|k表示把第h类误判成第y类的代价;3将待评估河流的特征数据作为测试数据集代入KNN模型中,得到河流幸福等级;步骤3具体包括:31参考相近评价中已有的国家或者行业标准,流域水资源、经济社会相关规划及制度的目标值以及相关经典文献中对应的指标标准,对选取的15项核心特征的标准进行划分,共将河流幸福情况分为幸福、基本幸福、较幸福、较不幸福和不幸福5种等级;32将待评估河流的各项指标数据用步骤21中的公式进行无量纲处理,然后输入到构造好的模型中,得到河流幸福等级结果。

全文数据:

权利要求:

百度查询: 河海大学 一种基于KNN算法的河流幸福等级评估方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。