首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种电力系统运行方式数据特征两阶段选择方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:国家电网公司东北分部;清华大学;国家电网有限公司

摘要:本发明属于电力系统运行和控制技术领域,涉及一种电力系统运行方式数据特征两阶段选择方法。首先通过基于标准化互信息和交互信息增益的IG‑RFE特征选择Filter阶段算法,去除相关算法中的先验参数并且正确判断特征之间的复杂依赖关系,从而实现电力系统运行方式数据关键特征的自动搜寻和提取;然后通过改进混合核函数SVM算法协同递归特征消除RFE搜索方法进行不良特征的移除,直到获得结果数量为预设值大小的特征集合,实现了电力系统关键特征高效、准确自动搜寻。本方法提高了电力系统运行方式数据特征选择的效率和准确率,为电网运行方式数据特征选择提供技术依据和实用化方法。

主权项:1.一种电力系统运行方式数据特征两阶段选择方法,该方法包括以下步骤:(1)对电力系统运行方式数据进行基于标准化互信息和交互信息增益的Filter阶段特征选择,包含以下步骤:(1-1)从电力系统的同步矢量测量单元中获取电力系统运行方式数据,并对数据中的缺失数据进行补充,对重复数据进行删除,得到有效数据,对每一组运行数据构建出一个样本以及样本的特征,按照暂态稳定与否对样本打上0或1的标签,记做样本的类别属性C;(1-2)构建一个已选特征子集S,初始化S为空集;构建一个备选特征集合US,初始化为空集;分别构建集合S和集合US的分类准确率指标,记做Acc(S)和Acc(US),初始化时将Acc(S)和Acc(US)分别设为0;上述AccUS和AccS分别表示目标最优特征子集S和备选特征集合US的分类准确率,分类准确率的计算公式如下: 式中,TP、FN、FP和TN分别表示在给定的机器学习算法中,二分类问题的样本被正确地划分为正例的样本个数、被错误地划分为负例的样本个数、被错误地划分为正例的样本个数和被正确地划分为负例的样本个数;(1-3)根据步骤(1-1)的有效数据,构建一个电力系统运行方式数据的初始特征集合,将备选特征集合US更新为该初始特征集合;(1-4)采用Parzen窗方法,对当前的备选特征集合US中的各个特征进行离散估计和概率密度估计,得到电力系统运行方式数据特征的概率分布,即特征的概率分布、特征的联合概率分布,特征类别属性C的概率分布和特征在特征类别属性C下的条件概率分布;(1-5)利用下式,分别计算步骤(1-4)的备选特征集合US中的所有特征f和类别属性C的标准化互信息: 其中,表示特征f和特征类别属性C之间的互信息,即: 表示特征f的信息熵,表示特征类别属性C的信息熵,对于单个连续变量X,信息熵的计算公式如下: 其中px是变量X的概率分布;将中取值为零的相应特征从备选特征集合US中剔除;(1-6)计算步骤(1-4)的备选特征集合US中任意两个特征之间的NIG指标和Score指标,利用下式形成每个特征的IG-RFE评价标准结果,即对备选特征集合US的每个特征进行计算,得到备选特征集合US中所有特征的权重得分: 其中,N为备选特征集合US中的特征数量;Score指标的表达式如下: (1-7)对步骤(1-6)中所有特征的权重得分的进行降序排列,从备选特征集合US中剔除与max1,r*N个排序中的最小权重得分相对应的特征,其中r为后向搜索单次迭代最小剔除比例,N为备选特征集合US中特征的总个数;(1-8)对步骤(1-7)的备选特征集合US中特征的总个数进行判断,若US为空集,则将当前的已选特征子集S输出作为最优特征子集,实现电力系统运行方式数据特征的两阶段选择;若US不为空集,则将当前的备选特征集合US作为步骤(2)的输入,进行第二阶段的筛选;(2)以步骤(1)所得到的备选特征集合US作为改进混合核函数SVM的输入,进行第二阶段Wrapper特征选择,包含以下步骤:(2-1)采用改进混合核函数支持向量机算法,以备选特征集合US为输入,根据10折交叉验证方法对备选特征集合US进行分类训练,输出得到当前备选特征集合US的分类准确率Acc(US);(2-2)将已选特征子集S的分类准确率AccS与步骤(2-1)计算得到的备选子集US分类准确率进行比较,若AccUS大于AccS,则将S更新为US,并将AccS更新为AccUS,返回步骤(1-4),若AccUS小于或等于AccS,则直接返回步骤(1-4);所述的步骤(1-1)中的初始特征集合为电力系统中故障前稳态运行数据信息,包括元件特征数据和系统特征数据,所述的元件特征数据包含故障前系统中每台发电机组的有功功率和无功功率、故障前系统中各节点负荷的有功功率和无功功率、输电线路的有功功率和无功功率、故障前系统中各母线的电压和相角;所述的系统特征数据为故障前系统中发电机的总有功出力和总无功出力、故障前系统中全部有功负荷和全部无功负荷、故障前系统中机械输入功率总和、故障前系统中总无功储备容量、故障前电力系统网络拓扑指标;所述的步骤(1-4)中的Parzen窗方法为非参数估计方法,对步骤(1-1)中数据清洗后的电力系统运行方式数据特征进行空间划分,以频数作为空间中心点坐标对应的概率,获得运行方式数据特征的密度分布;所述的步骤(1-6)NIG指标为标准化信息增益指标,表达式如下: 其中,表示特征fi、fj及类别属性C之间的交互信息增益指标,表示特征的信息熵。

全文数据:

权利要求:

百度查询: 国家电网公司东北分部 清华大学 国家电网有限公司 一种电力系统运行方式数据特征两阶段选择方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术