0前言

电力工程造价是一项非线性的多变量工作,仅仅依赖工作人员基于经验之上的臆断是不可行的,难以保证电力工程造价预测的准确性。数据挖掘技术在现有的海量数据当中将具有利用价值的数据提取出来并加以计算,神经网络技术则是在海量神经元的基础上构建自适应非线性动态系统,具有理想的非线性映射能力。如何在电力工程造价当中应用上述的两项新型技术,是相关从业人员需要重点思考的问题之一。

1数据预处理

数据挖掘当中的核心技术为数据预处理技术,其与数据挖掘过程的可操作性、最终结果的可信度有着直接的关系。针对电力工程造价而言,关于其历史数据的预处理技术主要可分为三种,分别为:数据集压缩技术、噪声数据平滑技术、空缺值填补技术。同时电力工程造价的影响因素较多,包括档距、绝缘子等、电压等级、运距等,其对电力工程造价的影响是不容忽视的,并且各个影响因素均下辖着子因素,层次数据仓库比较规范而有序。电力工程造价层次数据仓库示意图如图1所示。鉴于上述的各项因素属性基本上都跟数据挖掘的工作任务有关,因此在进行数据挖掘的过程当中,一则所花费的时间比较长,二则各个因素属性之间的重复性无法消除,造成最终的计算结果失真,可信度不高。所以,笔者认为:数据挖掘结果的可信度以及数据存取时间的长短,直接取决于用来创建模型的因素属性集的选择是否合理。可将因素属性的选择过程划分为如下两个步骤实施:(1)基于属性转换与属性归约的原始数据集压缩操作电力工程造价的属性数量非常多,仅仅是针对地形过状况的描述就涉及到丘陵、平原、山地、盆地等方面,并且其各自所占的比例均存在着较大的差异。因此,建议采用加权平均的方式把表一当中所列举的因素属性转换为单一而具体的地形系数属性,具体的计算公式为:W1×丘陵比例+W2×平原比例+W3×山地比例+W4×盆地比例式中:W1、W2、W3、W4均为与之相对应的地形的权系数,其来源为电力工程造价领域权威专家的设定,不存在固定的标准。(2)基于过滤算法与包装算法的深层次属性优选过滤算法与包装算法均属于启发式搜索算法的范畴,电力造价数据的特点多种多样,利用过滤算法与包装算法可确保计算结果的准确性,实现对因素属性的深层次优选目的。笔者认为,对电力领域的单位工程造价的影响最为突出的是截面与电压两项,其余还包括档距、运距、杆塔数、绝缘子等,将上述的全部因素属性全部加以离散化处理,重新构造类别属性,通过多次的试验,优选最终的子集,提高数据预处理的可操作性。电力工程造价因素输出属性关系图如图2所示。

2数据挖掘和神经网络技术之下的电力工程造价预测

2.1基于K-means聚类法的模糊规则选取。针对不同的数据结构以及数据类型而言,可通过K-means聚类法完成距离函数的选取,并将其作为对象相似性度量的可信标准,其与欧几里得度量的原理基本一致。在K-means聚类法之下,可生成电力工程造价的模糊规则,把具备相似性的全部工程子项目归纳到同一组当中去,需要注意的是,该处所指的相似性为属性之间的相对大小,而非绝对数值的相对大小。鉴于此,将余弦距离当做电力工程造价对象相似度的具体度量标准,能够较为准确地展示出不同向量的相似关系、向量元素的的变化特征等。选择聚类数目同样是聚类分析当中的关键性问题,系统的复杂度以及精度是其中需要重点考虑的两个问题。在试验的基础上,对聚类的数目实现逐步的改变,同时留意平方误差和的变化情况,聚类数目的选择需要依据此指标的变化程度来完成。基于保证系统简洁性以及精准性的重要目的,笔者建议选择2作为聚类数目,在此基础上所得到的模糊规则可切实提高所创建的模型的精度。此外,基于K-means聚类法的模糊规则选取还可减少迭代计算的次数,提高能量函数值,无论是连接权初值抑或是神经网络隐层元数目的选取方面均具有高度的可信性,不需要再依靠工作人员基于经验层面的臆断。

2.2确定模糊系统的隶属度函数。数据挖掘和神经网络的模型可切实提高电力工程各项造指标估算的精确度,尤其是单位静态投资形态,其最大误差值不会理论上超过3.45%,具有高度的可信性。由此可见,数据挖掘和神经网络技术的泛化能力均比较强,在该模型之下,针对电力工程造价估算所需的时间较短,并且精确度较高,具有理想的实际应用价值。除此之外,通过数据挖掘和神经网络技术而创建的专业模型在电力工程造价预算的审查方面同样具有高度的实际应用价值。电力工程造价预算审查的基准值即为神经网络系统的快速造价估算值,与设计预算书进行全面的对比,在此基础上就电力工程分项目造价预算的准确性实现深层次的判断。电力工程线路数据的预算审查对象主要包括工地运输、基础工程、土石方工程、附件工程、杆塔工程等。通过审查可知,工地运输、基础工程、土石方工程、附件工程、杆塔工程等的准确度均非常高,尤其是基础工程与杆塔工程两个方面,造价预算的预测值与实际值之间的绝对误差小于1.03%,证明数据挖掘和神经网络技术可在电力工程造价领域大理推广应用。

4结语

综上所述,在电力工程造价预测与审查当中,数据挖掘以及神经网络技术均可起到预期当中的作用,具有高度的实际应用价值。通过数据挖掘技术针对海量的原始数据实现预处理,在此基础上可得到理想的数据规模以及数据格式。随后通过神经网络技术对所创建的专业模型的优点进行详细的描述,可以起到克服人工预测与审查的主观性与片面性的弊端,降低人为因素对电力工程造价预算与审查工作的负面影响,保证评价结果的客观性以及有效性。笔者在测试实际数据的基础上,对数据挖掘和神经网络技术在电力工程造价应用价值与特征进行了深入的论证与分析,得出了此方法在电力工程造价预测与审查当中具备预测精确性、审查收敛性的重要作用,可大力推广应用。