摘要:研究了RBF神经网络在城市燃气日负荷预测中的应用及输入变量的选择问题,提出了基于逐步回归的输入变量选取方法。对实例进行了预测,对不同输入变量方案进行了对比分析。以逐步回归选取的输入变量为基础,增加日期类型、前一天平均气温两项数据作为输入变量,完全满足神经网络用于城市燃气日负荷预测精度的要求,且合理可行。
关键词:神经网络;城市燃气;负荷预测;输入变量;自变量
Selection of Input Variables in Daily Gas Load Forecast Based on Artificial Neural Network
YAO Jian,ZHOU Wei-guo,ZHANG Zhong-xiu
Abstract:The application of RBF neural network to daily city gas load forecast and the selection of input variables are studied. The selection method of input variables based on stepwise regression is put forward. A case forecast is carried out,and a comparison among schemes with different input variables is made. Based on the input variables selected by stepwise regression,adding date type and average air temperature of previous day as input variables can meet the accuracy requirement of neural network for daily city gas load forecast,and it is reasonable and feasible.
Key words:neural network;city gas;load forecast;input variable;independent variable
1 概述
神经网络经过逾60年的发展,已经形成了多种模型、算法,广泛应用于各个领域。在城市燃气负荷预测中,不同的模型、算法表现出各自的优缺点。目前较为成熟的应用于城市燃气负荷预测的方法主要为BP网络及RBF网络。这两种方法在一定范围内具有实用性[1~5]。谭羽非等[1]用BP神经网络建立了既反映煤气负荷连续性、周期性及变化趋势,又包含天气、气温、节假日等影响因素的短期负荷预测模型;李持佳等[2]考虑天气。温度、传统节假日等因素,采用BP网络和RBF网络相结合的方法对春节期间燃气负荷进行预测;肖文晖等[3]采用改进模糊神经网络进行小时燃气负荷预测;梁金凤等[4]运用GCAQBP神经网络对燃气日负荷进行了预测;陈飞等[5]采用训练速度快的RBF神经网络对燃气日负荷进行了预测,结果表明RBF神经网络满足预测需求。
2 RBF网络
RBF网络是一种两层前向型神经网络,包含一个具有径向神经元的隐层和一个具有线性神经元的输出层。
RBF网络和普通的前向网络有所不同,隐层神经元是径向基神经元而不是tansig或者logsig神经元。普通前向网络中sigmoid神经元能够覆盖较大的输入区域,但是普通前向神经元数目在训练前就已经固定下来。而径向基神经元虽然只对相对较小的区域产生响应,但是在输入区间较大时,可以适当地增加径向基神经元来调整网络,从而达到精度要求。且RBF网络的设计比普通前向网络训练要省时得多[6]。RBF网络模型预测流程见图1。
3 输入变量的选取
一般认为,为了预测精确,希望输入尽可能多的变量,特别是对负荷有显著作用的因素不能遗漏;另一方面,为了使用方便,又希望变量尽量少,这是因为输入变量的增加意味着使用模型时必须测定更多的量。此外,如果输入变量之间有存在着一定的线性或非线性的相关性,会造成信息的冗余。在保证预测精度的前提下,如何合理可行地选取输入变量成了神经网络应用于城市燃气负荷预测的关键问题。
统计学在采用多元线性回归建模过程中,常采用逐步回归法对变量进行筛选。逐步回归法是从一个自变量开始,按自变量对因变量影响的显著程度,从大到小逐步引入回归方程。当先引入的变量由于后面变量的引入变得不显著时,则随时将它们从回归方程中剔除,以保证每次在引入新的显著变量以前回归方程中只包含显著的变量,直至没有显著的变量可以引入回归方程为止。它能实现在可能影响因变量的、为数众多的初始因数中“挑选”自变量,以建立自变量少、精度高的模型[7]。
虽然线性回归建模和神经网络建模存在着差异,但是仍可以借鉴逐步回归的方法选取输入变量。正因为神经网络可以模拟高度复杂的非线性系统,所以可以在逐步回归法选出的变量基础上新增输入变量,通过实际结果检验其合理性。
4 算例分析
一般认为非工业用气占主体的城市,气象因素是冬季城市燃气日负荷的关键因素[8]。本文以北方某中型城市日用气量和气象数据作为研究对象,对所有的13个变量进行相关性分析,初步判断影响冬半年(11月至次年3月)燃气日用气量的主要气象因素。其中累计气温的计算公式为:
tc=0.5t0+0.3t1+0.2t2 (1)
式中tc——累计气温,℃
t0——当天平均气温,℃
t1——前一天平均气温,℃
t2——前第二天平均气温,℃
相关性计算结果见表1。
表1 冬半年燃气日用气量与气象因子相关性计算结果
气象因子
|
累计气温
|
当天平均气温
|
当天最高气温
|
当天最低气温
|
相关系数
|
-0.915
|
-0.893
|
-0.870
|
-0.820
|
气象因子
|
当天8时气温
|
当天平均气压
|
当天日照时数
|
当天相对湿度
|
相关系数
|
-0.819
|
0.650
|
-0.233
|
0.053
|
气象因子
|
当天14时云量
|
当天降水量
|
当天最大风速
|
当天8时云量
|
相关系数
|
-0.050
|
-0.030
|
-0.025
|
0.016
|
以当天用气量为因变量,以前一天气量、当天平均气温、当天最高气温、当天最低气温、当天平均气压、当天日照时数、当天日均湿度、当天平均云量、当天降水量、当天最大风速10项指标作为自变量,采用逐步回归法进行因子舍选计算。
结果表明,冬半年因子舍选的结果是:前一天气量、当天平均气温、当天日照时数。其中当天日照时数虽然相关系数不高,但由于具有很好的独立性,能够起到信息补充的作用,因此被选为日用气量的主要影响因素之一。但是作为神经网络的输入变量,还有待模型预测结果检验。
由表1可见,累计气温与日负荷相关性最大,可考虑把前一天日平均温度作为输入参数。但鉴于已把与前一天气温相关性极高的前一天用气量作为输入变量,前一天气温作为输入变量是否合理还有待模型计算检验。
鉴于冬半年周末用气量比平时工作日低的特点[8],也把日期类型纳入影响因素。谭羽非等[1]也把日期类型作为神经网络的输入参数用于日负荷预测。
本文以3组不同的参数组合为输入变量,采用同一收敛精度、稳定性较好的RBF神经网络对1月份某1个星期的日负荷进行预测。
3组输入参数分别为:
A组输入参数:前一天气量、平均温度、日期类型、日照时数、前一天气温。
B组输入参数:前一天气量、平均温度、日期类型、前一天气温。型、日照时数。
输入参数按照不同的数据类型分别采用Matlab中premnnx函数进行归一化至[-1,1]。设定均方差精度为0.001,散布常数为1000。
训练样本为11月、12月的数据。考虑到元旦假日的影响,预测对象为1月份第1个完整的星期。C组输入参数:前一天气量、平均温度、日期类 模型预测结果见表2。
表2 模型预测结果
日期
|
真实值/(m3·d-1)
|
A组
|
B组
|
C组
|
|||
预测值/(m3·d-1)
|
相对误差/%
|
预测值/(m3·d-1)
|
相对误差/%
|
预测值/(m3·d-1)
|
相对误差/%
|
||
1月9日
|
181130
|
181897
|
0.42
|
181638
|
0.28
|
181283
|
0.08
|
1月10日
|
180349
|
181106
|
0.42
|
180188
|
0.09
|
180203
|
0.08
|
1月11日
|
185068
|
181417
|
1.97
|
179245
|
3.15
|
182083
|
1.61
|
1月12日
|
182699
|
176593
|
3.34
|
174485
|
4.50
|
177027
|
3.10
|
1月13日
|
167929
|
168343
|
0.25
|
168028
|
0.06
|
170103
|
1.29
|
1月14日
|
171572
|
173081
|
0.88
|
171444
|
0.07
|
175312
|
2.18
|
1月15日
|
163977
|
168544
|
2.78
|
167983
|
2.44
|
166971
|
1.83
|
平均相对误差/%
|
1.44
|
1.51
|
1.45
|
从表2可以看出,除1月12日B组预测结果的相对误差绝对值大于3.5%以外,其余所有点预测结果的相对误差绝对值均小于3.5%。
A组平均误差最小,说明输入变量的增加增大了信息量,提高了预测精度。虽然输入变量之间存在一定的相关性,但是由于神经网络的自学习功能,通过权值及阈值的调整消除信息冗余对预测造成的不利影响。
B组平均误差基本上大于C组,说明冬半年日照时数对用气量的影响比前一天气温对用气量的影响大。
5 结论
① 以逐步回归法选取的自变量为基础,增加日期类型、前一天气温两项数据作为输入变量,完全满足神经网络用于城市燃气负荷预测精度的要求,且合理可行。
② 日照时数是影响冬半年日用气量的重要因素。
③ RBF神经网络训练速度快,可复现,精度满足工程应用要求。
参考文献:
[1] 谭羽非,陈家新,焦文玲.基于人工神经网络的城市煤气短期负荷预测[J].煤气与热力,2001,21(3):199-202.
[2] 李持佳,焦文玲,朱建豪,等.基于人工神经网络的春节期间燃气负荷预测[J].煤气与热力,2004,24(9):477-482.
[3] 肖文晖,刘亚斌,王思存.燃气小时负荷模糊神经网络预测[J].煤气与热力,2002,22(1):16-19.
[4] 梁金凤,陈飞,马庆元,等.鞍山市燃气日负荷预测的研究[J].煤气与热力,2006,26(10):16-19.
[5] 陈飞,梁金凤,高铸,等.基于径向基神经网络的燃气日负荷预测[J].煤气与热力,2007,27(5):18-19.
[6] 董长虹.Matlab神经网络与应用[M].北京:国防工业出版社,2007.
[7] 中国科学院数学研究所数理统计组.回归分析方法[M].北京:科学出版社,1974.
[8] 张中秀,周伟国,梁金凤.冬半年城市燃气日负荷规律研究[J].煤气与热力,2008,28(8):B07-B09.
(本文作者:姚健 周伟国 张中秀 同济大学 机械工程学院 上海 200092)
您可以选择一种方式赞助本站
支付宝转账赞助
微信转账赞助