摘要:对电力通信网可靠性的研究来源于对电力通信网设备故障的研究,因此,对电力通信网设备故障评估方法的研究是非常有意义的。本文采用k-均值聚类方法对电力通信网故障情况进行分类,采用径向基神经网络方法对故障分类情况建立神经网络模型,其中,采用粗糙集方法降低训练神经网络时的网络输入维数,利用反映故障情况的故障综合指数确定故障等级。最后,用该方法解决一个实例问题来展现其优势。 

关键词:电力通信网  故障评估  k-均值聚类  粗糙集  径向基神经网络 
1 概述 
电力通信网是现代电网不可分割的组成部分,是电网安全、稳定、经济、优质运行的三大支柱之一[1],提高电力通信网的通信质量、增加电力通信网的可靠性是国家电网公司对电力通信网提出的一贯要求,这是贯穿整个电力通信网生命周期的持续过程[2]。可靠性问题起源于故障,通信网可靠性测度的演变与故障的研究是分不开的。在通信网中,故障测度的范畴可以分为设备故障与网络故障两个层面,网络故障是设备故障的深层次反映。随着电力通信网的不断发展,设备的不断更新,有必要对现代电力通信网的设备故障情况进行进一步研究。 
聚类分析试图将一组未标记样本按照一定的相似度准则分到几个类中去,使得在同一个类中的样本有着较大的相似度,不同类间的样本的相似度较小[3]。k-均值聚类算法是macqueen在1967年首次提出的一种经典聚类算法,具有能对大型数据集进行高效分类的优点。粗糙集理论(rough set)是波兰数学家z.pawlak教授于1982年提出的一种数据分析理论[4]。粗糙集方法能有效处理不确定、不精确、需要主观判断的问题,并能保证在不降低评价效果和质量的前提下对指标体系进行约简,去除冗余和相关的指标[5]。径向基神经网络(radial based function neural network,rbfnn)是20世纪90年代提出的一种具有全局收敛特性的线性学习算法的前馈网络,因其学习速度快的优点,广泛应用于数据的分类和时间序列的预测等方面。本文基于以上方法,对电力通信网设备故障评估进行研究。 
2 方法原理 
首先建立一套电力通信网设备故障评估指标体系,使用k-均值聚类方法对设备故障情况进行分类,然后用数据样本对径向基神经网络进行训练,训练网络前利用粗糙集方法降低输入维数,提高网络训练速度,然后从训练后的神经网络中提取指标重要度作为指标权重,从而求得综合指数来判断聚类的故障等级,使径向基神经网络具备故障评估能力。原理框图如图1所示。 
2.1 指标体系 
目前,电力通信网设备主要包括光纤通信设备、光缆线路、交换机设备、调度总机设备、无线设备、电力线载波设备、微波通信设备以及图传终端设备等,据此可以得到电力系统通信设备故障的7个一级指标,然后根据故障的三因素描述方法,可将每种设备故障情况用故障强度、持续时间和故障程度三个指标来描述,即每个一级指标具有3个二级指标。其中,故障强度是指故障对每一使用单位的作用力的大小,如故障概率和故障阈值的差值,持续时间是故障所持续存在的时间长度,故障程度是指故障所扩散的度量,如故障范围。从而可以得到具有21个二级指标的一个电力系统通信设备故障评估指标体系,如表1所示。 
2.2 k-均值聚类 
本文利用k-均值聚类方法将某省各局电力通信网设备故障情况分为三个等级类。首先,从观测数据集中任意选择3个观测值作为初始聚类中心,其余观测值则根据与这3个聚类中心的距离和最近距离原则,逐个分别聚类到这3个聚类中心所代表的聚类中。然后在完成第一轮聚类之后,各聚类中心发生了变化,继而更新3个聚类的聚类中心,也就是分别根据各聚类中的观测值计算相应聚类的均值。根据所获得的3个新聚类中心,以及各对象与这3个聚类中心的距离,根据最近距离原则对所有观测值进行重新归类。重复上述过程就可获得最终的聚类结果。 
2.3 粗糙集 
本文利用粗糙集方法对指标集进行有效约简。首先,将指标集作为条件属性,聚类结果作为决策属性,构造决策信息表。然后利用粗糙集方法对决策信息表中的数据进行分析,然后根据得到的指标质量值,删减掉指标质量较小的指标,保留质量较大的指标,最终得到一个有效约简后的电力通信网设备故障评估指标集。 
2.4 径向基神经网络 
径向基神经网络第一层为输入层,由信号源节点组成,第二层为隐含层,用径向基函数作为隐单元的“基”构成隐含层空间,其单元数视作所面对问题的需要而定,第三层为输出层,它对输入模式的作用做出响应。 
将使用粗糙集方法约简后的指标集所对应的数据样本作为径向基神经网络的输入,k-均值聚类结果作为网络输出,以此来训练神经网络,使其具备故障分类能力,然后从训练好的神经网络中提取指标的重要性,以此作为指标权重,根据数据样本和指标权重,计算各局电力通信网设备故障情况综合指数,从而便可以判断出各聚类所对应的故障等级。 
3 实例 
3.1 信息表 
通过调研得到某省各局电力系统通信设备故障报告,经过数据的整理,得到数据样本。 
由于该省各局电力通信网设备中电力线载波设备与图传终端设备并未发生过故障,所以本例中指标t16~t21对各局故障的情况综合评估没有价值,所以剔除掉指标t16~t21。最终的信息表如表2所示。 
3.2 k-均值聚类分析 
将指标t1~t15作为聚类变量,根据表2中的统计数据对各局故障情况进行聚类。设置聚类数k=3,使用运行均值,迭代29次后,聚类中心收敛。初始中心间的最小距离为2.396。最终聚类中心间的距离为1.402。聚类结果如表3所示。 
可见a、b、c、e、f、i、j、k局的通信设备故障情况相同,为3类,而d、h、l局的通信设备故障情况相同,为1类,g局通信设备故障情况与其他局均不同,为2类。 
3.3 粗糙集约简 
指标属性作为条件属性,聚类结果作为决策属性,形成决策表,利用粗糙集方法进行分析,得到指标质量如图2所示。 
剔除掉质量较低的指标,最终可以得到约简后的指标集为{t1,t2,t3,t4,t5,t6,t10, t11,t12}。 
3.4 径向基神经网络 
将约简后的指标集所对应的样本数据作为网络输入,聚类结果作为网络输出,根据数据样本对网络进行训练。具体网络参数如表4所示。 
由此得到了一个具有故障分类能力的径向基神经网络。然后从该神经网络中提取各自变量的重要性,即指标重要性,如表5所示。 
将指标重要性作为指标权重,再依据样本数据,利用加权平均的计算方法求得各局电力通信网设备故障的综合指数,并与聚类结果比较,如表6所示。由于电力通信网设备故障指标对故障评估都是正向指标,所以,故障综合指数较大的局的故障也较严重。 
根据表6所示,可以定义“1”类故障情况为“严重”,“2”类故障情况为“一般”,“3”类故障情况为“轻微”。 
3.5 结果 
根据该电力系统通信设备故障评估方法对实例的分析,得到d局、h局、l局的通信设备故障较严重,需要引起重视,g局通信设备的故障情况一般,其他局通信设备的故障情况较轻微。 
4 结论 
本文基于k-均值聚类评估方法、粗糙集理论以及径向基神经网络方法提出了电力通信网设备故障评估方法,并对一实例进行分析,最终得到了其评估结果。在该评估方法中基于k-均值聚类方法对故障情况进行分类,再用综合指数确定聚类的故障等级,避免了传统评估方法对评估前指标权重的依赖,也避免了常用的灰色聚类方法对白化权函数的依赖,排除了诸多主观因素的的干扰,加强了故障评估结果的客观性、真实性。 
参考文献: 
[1]穆琦.电力通信网中通信电源的运行维护管理[j].内蒙古石油化工,2008,5:71-73. 
[2]赵子岩,陈希,刘建明.建立电力系统通信网可靠性管理体系相关问题的探讨[j].电力系统通信,2006,27(168):58-61. 
[3]汪军,王传玉,周鸣争.半监督的改进k-均值聚类算法[j].计算机工程与应用,2009,45(28):137-139. 
[4]云俊,李远远.项目评价中指标体系选取的有效性及优化[j].商业时代,2009,(9):47-48. 
[5]舒红平,王运峰,徐振明,邹书蓉.基于k-均值聚类的多雷达数据融合算法研究[j].计算机工程与应用,2007,43(16):183-185. 
[6]张建明,曾建武,谢磊,王树青.基于粗糙集的支持向量机故障诊断[j].清华大学学报(自然科学版),2007,47(s2):1774-1777.