Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种污染源在线监测数据中的造假数据分析方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:成都中环科创科技有限公司

摘要:本发明公开了一种污染源在线监测数据中的造假数据分析方法,属于数据分析技术领域,通过从指定数据源采集历史污染源监测数据,并通过深度学习算法对历史污染源监测数据与造假行为之间的数据关系进行学习之后,形成可分析造假数据的规则,最后通过可分析造假数据的规则对待分析的污染源在线监测数据进行识别,即可得到造假数据分析结果,能够有效识别和分析污染源在线监测数据中的异常值和造假行为,提高环境监管的准确性和有效性。

主权项:1.一种污染源在线监测数据中的造假数据分析方法,其特征在于,包括:从指定数据源采集历史污染源监测数据,并对所述历史污染源监测数据进行预处理之后,得到用于训练算法模型的样本数据;采用深度学习模型构建造假数据分析模型,并以所述样本数据为基础,采用多层次信息探索算法对造假数据分析模型进行训练,得到训练之后的造假数据分析模型;采集待分析的污染源在线监测数据,并提取所述污染源在线监测数据的特征之后,将提取的特征输入至训练之后的造假数据分析模型中进行识别,得到造假数据分析结果;从指定数据源采集历史污染源监测数据,并对所述历史污染源监测数据进行预处理之后,得到用于训练算法模型的样本数据,包括:从指定数据源采集历史污染源监测数据;对所述历史污染源监测数据依次进行数据完整性检查、时间序列分析以及数据平滑处理,得到完整的历史污染源监测数据;针对完整的历史污染源监测数据,获取工作人员根据历史造假事件并通过人机交互输入的企业数据画像;其中,所述企业数据画像包括正常数据类型以及多种类的异常数据类型;将完整的历史污染源监测数据作为训练数据,将完整的历史污染源监测数据所对应的企业数据画像作为训练标签,得到用于训练算法模型的样本数据;所述历史污染源监测数据至少包括时间特征、气象条件特征、污染物浓度特征以及排放源特性特征;其中,所述时间特征包括小时、日、月以及年;所述气象条件特征包括温度、湿度、风速、风向以及大气压力;所述污染物浓度特征包括SO2浓度、NOx浓度、PM2.5浓度以及PM10浓度;x表示数字下标,且x=1、2以及3;所述排放源特性特征包括排放源类型、排放源规模、产能以及排放源的运营时间;对所述历史污染源监测数据依次进行数据完整性检查、时间序列分析以及数据平滑处理,得到完整的历史污染源监测数据,包括:检查所述历史污染源监测数据中是否存在缺失值,若是,则采用缺失值前后邻近的数据的均值进行逐一补全,得到完整性检查之后的历史污染源监测数据,否则直接将原有的历史污染源监测数据作为完整性检查之后的历史污染源监测数据;针对完整性检查之后的历史污染源监测数据,确定时间序列中是否存在缺失的历史污染源监测数据,若是,则采用该缺失历史污染源监测数据前后邻近的历史污染源监测数据的均值进行逐一补全,得到时间序列分析之后的历史污染源监测数据,否则直接将原有的历史污染源监测数据座位时间序列分析之后的历史污染源监测数据;其中,所述时间序列是指将某一个时间点上采集的历史污染源监测数据看作一帧数据,将多个连续时间点上的多帧数据连接起来所得到的数据;针对完整性检查之后的历史污染源监测数据,对历史污染源监测数据进行数据平滑处理,得到完整的历史污染源监测数据;以所述样本数据为基础,采用多层次信息探索算法对造假数据分析模型进行训练,得到训练之后的造假数据分析模型,包括:采用混沌序列初始化策略对造假数据分析模型的超参数进行初始化,以获取多个在超参数解空间内均匀分布的超参数个体;针对每一个超参数个体,将所述超参数个体应用至造假数据分析模型之后,根据样本数据获取造假数据分析模型输出的误差函数值,并将所述误差函数值转换为适应度值,得到超参数个体所对应的适应度值;根据所述超参数个体所对应的适应度值,确定最优超参数个体;以每个超参数个体对应的适应度值为基础,对超参数个体执行邻域信息探索策略,得到一级信息探索之后的超参数个体;针对一级信息探索之后的超参数个体,根据所述最优超参数个体对超参数个体执行全局最优位置信息探索策略,得到二级信息探索之后的超参数个体;针对二级信息探索之后的超参数个体,根据所述最优超参数个体对超参数个体执行种群信息交互探索策略,得到三级信息探索之后的超参数个体;针对三级信息探索之后的超参数个体,对超参数个体执行信息跳跃探索策略,得到四级信息探索之后的超参数个体;判断是否满足迭代结束条件,若是,则根据四级信息探索之后的超参数个体重新获取最优超参数个体,并将重新获取的所述最优超参数个体作为造假数据分析模型的最终超参数,得到训练之后的造假数据分析模型,否则返回确定超参数个体所对应的适应度值的步骤;以每个超参数个体对应的适应度值为基础,对超参数个体执行邻域信息探索策略,得到一级信息探索之后的超参数个体,包括:以每个超参数个体对应的适应度值为基础,确定超参数个体的探索步长为: 其中,表示第t次训练过程中第i个超参数个体对应的探索步长,表示第t+1次训练过程中第i个超参数个体对应的探索步长;i=1,2,…,N,N表示超参数个体的总数;表示衰减系数,且1;表示中间参数,表示第i个超参数个体对应的适应度值,表示当前训练过程中的最大适应度值,表示当前训练过程中的最小适应度值,表示预设的常数项;根据超参数个体的探索步长,对超参数个体执行邻域信息探索为: 其中,表示第t次训练过程中第i个超参数个体的第d维超参数,d=1,2,…,D,D表示超参数个体中的维度总数,表示一级信息探索之后的超参数个体的第d维超参数,表示(-1,1)之间的随机数,表示第d维超参数的长度,即第d维超参数的上限减去下限;针对一级信息探索之后的超参数个体,根据所述最优超参数个体对超参数个体执行全局最优位置信息探索策略,得到二级信息探索之后的超参数个体,包括:针对一级信息探索之后的超参数个体,根据所述最优超参数个体确定加权数为: 其中,表示(0,1)之间权重系数,表示第t次训练过程中第i个一级信息探索之后的超参数个体的第d维超参数,表示最优超参数个体的第d维超参数,表示加权数;针对一级信息探索之后的超参数个体,根据所述最优超参数个体确定均值数为: 其中,表示均值数;根据所述加权数以及所述均值数,确定对超参数个体执行全局最优位置信息探索为: 其中,表示均值为以及方差为的高斯分布,表示二级信息探索之后的超参数个体的第d维超参数;j=1,2,…,N,N表示超参数个体的总数;针对二级信息探索之后的超参数个体,根据所述最优超参数个体对超参数个体执行种群信息交互探索策略,得到三级信息探索之后的超参数个体,包括:为第m个二级信息探索之后超参数个体随机确定两个其他超参数个体,得到第一随机个体以及第二随机个体;根据最优超参数个体、第一随机个体以及第二随机个体,确定更新量为: 其中,表示第一随机个体的第d维超参数,表示第一随机个体的第d维超参数,表示第二随机个体的第d维超参数,表示最优超参数个体的第d维超参数,表示第t+1次训练过程中第m个超参数个体对应的探索步长,表示超参数个体的第d维超参数对应的更新量;根据所述更新量,对超参数个体执行种群信息交互探索为: 其中,表示超参数个体的第d维超参数,表示均值为0,方差为1的标准高斯分布产生的随机数,表示三级信息探索之后的超参数个体的第d维超参数,表示探索系数,表示第d维超参数的长度,m=1,2,…,N,N表示超参数个体的总数;针对三级信息探索之后的超参数个体,对超参数个体执行信息跳跃探索策略,得到四级信息探索之后的超参数个体,包括: 其中,表示第t次训练过程中第m个三级信息探索之后的超参数个体的第d维参数,表示四级信息探索之后的超参数个体的第d维参数,表示第二中间参数,表示常数项,且=0.012,表示最优超参数个体的第d维参数,表示第三中间参数,表示(0,1)之间的随机数,表示第一控制因子,且满足正态分布,表示第四中间参数,,表示伽马函数,表示圆周率,v表示第二控制因子,且v满足正态分布。

全文数据:

权利要求:

百度查询: 成都中环科创科技有限公司 一种污染源在线监测数据中的造假数据分析方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。