-
短期电力负荷预测是指以分、小时、天、周为单位的负荷预测[1-3]。现阶段的短期电力负荷预测模型主要分为时间序列模型和特征学习模型两大类。时间序列模型中自回归差分滑动平均模型(autoregressive integrated moving average, ARIMA)已经用于很多负荷预测中,包括中长期电力负荷预测[4];特征学习模型主要为神经网络模型,包括BP神经网络[5]、长短时记忆网络(long short-term memory, LSTM)[6-7]和支持向量机(support vector network, SVM)等[8]。BP神经网络存在网络结构简单、预测精度低等问题;支持向量机在小数据集上表现良好但仍存在预测准确性较低等问题,且上述两种网络均未考虑到数据之间相关性,难以表征时域特征。现实生活中过早的电力负荷数据会造成预测训练数据过少,难以用于目前的电力负荷预测,使得LSTM等模型训练难度较大且训练精度较低[9]。文献[10]提出了时域卷积网络(temporal convolutional network, TCN),在小数据集上训练效果和训练时间相较于传统方法有着更为理想的表现。
现阶段很多学者考虑到了负荷数据存在随机性、周期性、非线性等特点。利用经验模态分解(empirical mode decomposition, EMD)将负荷数据分解成多组分解数据再进行预测,可提升预测的准确度[11]。但是该算法易出现模态混叠等问题,造成后续预测精度的降低。变分模态分解(variational mode decomposition, VMD)的提出,不仅可以解决模态混叠,还可以有效解决负荷数据存在随机性和非线性等问题。通过将VMD与LSTM相结合的方法对短期电力负荷进行预测,降低了数据的复杂度,解决了数据存在随机性、非线性等特点,但是小样本上训练精度仍可以提升[12]。文献[13]在TCN的基础上对时间和空间尺度上提出了多尺度时域卷积网络(multi-temporal-spatial-scale temporal convolutional network, MTCN),该方法使得网络可以更好地表征时域上的特征并提升预测精度,但当数据复杂度过高时,预测精度不够,且网络中仍存在可优化的部分。因此本文构建了一种VMD-MTCN-COSA-FC的电力负荷预测方法,利用VMD将电力负荷数据进行分解,将分解的分量送入TCN网络中利用不同的时间尺度进行训练,同时在TCN网络训练时利用余弦退火衰减优化算法(cosine annealing, COSA)优化神经网络训练中的学习率参数,最后利用全连接网络(fully connected networks, FCN)对每个分解信号的预测结果进行训练融合,获得最终的预测结果。
-
本文采用电工数学建模竞赛负荷预测数据集,数据为某地区3年内的日需求负荷数据,以天为采样频率,共1 106天,包括最高、最低、平均温度、相对湿度、降雨量以及日需求负荷这6维数据。由于湿度、气温和降雨等随机因素会提升负荷预测的复杂度,且增加了数据维度,因此本文实验仅采用电力负荷数据进行预测,选取其中1 000组数据,以8:2划分训练数据和测试数据,并选取训练集中的5%作为验证。评价指标选用均方根误差(RMSE)、平均绝对误差(MAE)和R2对实验结果进行评估。其公式分别为:
式中,m为样本数量;
$ y_{i} $ 为真实值;$ \hat{y}_{i} $ 为预测值;$ \bar{y}_{i} $ 为真实值的平均值。本文实验环境为Intel Core i5-7400 CPU,NVIDIA GeForce GTX 1050的4 GB和8 GB RAM。采用深度学习框架为tensorflow-gpu和keras。
-
为了降低原始负荷数据的随机性和非线性问题带来的影响,需要对原始负荷数据进行VMD分解,分解后的结果如图4所示,取其中200组分解结果如图5所示,观察图5中的模态4和模态5,其中心频率已经相近,当选取K>5时,后续中心频率十分接近,判断为过度分解。
本文通过计算分解子序列重组后信号与原始信号之间的失真程度来确定分解参数,其中经VMD分解后数据失真程度如表1所示。通过表1中实验1、2、3的失真程度对比可以确定模态数K选取为5;根据实验4、5、6、7确定在分解后失真程度相近时选取更大的惩罚函数
$ \alpha $ =900;根据实验6、8、9确定在失真程度相近时,选取更小的噪声容忍度$ \tau $ =0.3,以确保信号在数据不失真的情况下尽可能分解,降低数据的复杂度。实验 参数设置 RMSE MAE 1 K=4, $ \alpha $=1000, $ \tau $=0.3 6.559 5.065 2 K=5, $ \alpha $=1000, $ \tau $=0.3 1.757 1.329 3 K=6, $ \alpha $=1000, $ \tau $=0.3 1.911 1.404 4 K=5, $ \alpha $=1500, $ \tau $=0.3 14.907 11.026 5 K=5, $ \alpha $=1200, $ \tau $=0.3 5.586 4.082 6 K=5, $ \alpha $=900, $ \tau $=0.3 0.503 0.503 7 K=5, $ \alpha $=600, $ \tau $=0.3 0.503 0.503 8 K=5, $ \alpha $=900, $ \tau $=0.2 2.940 2.189 9 K=5, $ \alpha $=900, $ \tau $=0.4 0.503 0.503 -
本文采用VMD-COSA-MTCN-FC网络对负荷数据进行预测。网络主要由VMD分解模块、COSA-MTCN网络训练模块和FC模态融合模块3部分组成。输入负荷数据通过VMD分解模块获得K个模态分量。在COSA-MTCN模块中,对应每一个模态分量,选取对应其中心频率的时间尺度a、b、···、k,并根据各模态分量各自对应的时间尺度送入TCN网络中进行训练,对学习率采用余弦退火优化,最后输出K个模态分量的预测结果。模态分量的预测结果将输出到FC模态融合模块中,FC网络将K个预测结果作为输入层进行训练,通过隐层后在输出层输出训练结果,即为对原始负荷数据的负荷预测。
-
电力负荷数据存在随机性和周期性,本文通过实验确定每一种网络的最优时间长度。共选择10种方法与本文方法(VMD-MTCN-COSA-FC)进行对比实验:1) 反向传播神经网络(BP);2) LSTM;3) 门控循环单元(GRU);4) SVM中的支持向量回归(SVR);5) TCN;6) 基于经验模态分解的时域卷积网络(EMD-TCN);7) 基于变分模态分解的时域卷积网络(VMD-TCN);8) 基于变分模态分解和余弦退火优化的长短时记忆神经网络(VMD-LSTM-COSA);9) 基于变分模态分解和余弦退火优化的时域卷积网络(VMD-TCN-COSA);10) 基于变分模态分解和余弦退火优化的多尺度时域卷积网络(VMD-MTCN-COSA)。
每种方法的隐层参数、时间尺度以及激活函数的选取如表2所示,本文TCN膨胀系数采用[1,2,4,8],网络优化器均采用Adam,Dropout取0.1,学习率选择0.001,采用余弦退火优化的网络学习率范围为0.01~0.000 1,网络训练轮次均为300,SVR中其他参数采用Scikit-learn中默认参数。
实验名称 隐层参数 时间尺度 激活函数 BP [16,32,16] 16 Linear LSTM 75 5 Linear GRU 75 5 Linear SVM(SVR) \ 16 Gaussian TCN 64 18 ReLU EMD-TCN 64 18 ReLU VMD-TCN 64 18 ReLU VMD-LSTM-COSA 75 5 Linear VMD-TCN-COSA 18 18 ReLU VMD-MTCN-COSA 64 [18,20,22,24,18] ReLU VMD-MTCN-COSA-FC 64 [18,20,22,24,18] ReLU -
将实验数据送入网络中进行训练和预测,并用3种评价指标RMSE、MAE、R2进行评价,其实验结果如表3所示。为了说明各结构的优越性,将表3中后6种方法EMD-TCN,VMD-TCN,VMD-LSTM-COSA,VMD-TCN-COSA,VMD-MTCN-COSA以及本文方法的预测结果进行图表分析,并对各实验进行误差分析。由表3的实验结果可以看出,采用TCN方法进行预测相较于其他4种传统预测方法(BP,LSTM,GRU,SVR),RMSE和MAE的误差有一定程度的下降,说明TCN网络预测效果更好。
实验名称 RMSE MAE R2 BP 69.248 41.953 0.650 LSTM 68.279 46.586 0.507 GRU 65.365 45.370 0.543 SVM(SVR) 67.478 41.982 0.661 TCN 63.303 37.581 0.679 EMD-TCN 51.281 34.306 0.789 VMD-TCN 12.587 10.274 0.988 VMD-LSTM-COSA 13.495 10.906 0.984 VMD-TCN-COSA 10.16 7.569 0.991 VMD-MTCN-COSA 8.864 6.568 0.993 VMD-MTCN-COSA-FC 8.107 5.742 0.995 -
1) VMD分解结构预测结果
将表3中TCN、EMD-TCN和VMD-TCN的实验结果进行对比,可以发现采用VMD方法对原始数据进行分解,其RMSE下降明显。图6为不同分解方法的预测结果,可以看出经VMD分解预测结果更贴近真实值,说明VMD分解可有效降低数据的随机性及非线性的影响,提升预测精度。
2) 余弦退火优化结构预测结果
对表3中的VMD-TCN和VMD-TCN-COSA方法的实验结果进行对比,发现采用余弦退火优化方法的预测结果MAE下降了26%,R2提升0. 3%,图7为网络经COSA优化后预测结果,可以看出,经过COSA优化的方法预测曲线拟合度更高,验证了采用余弦退火对TCN网络进行优化,网络能够收敛于更优解。
3) 多尺度结构预测结果
对表3中的VMD-TCN-COSA和VMD-MTCN-COSA方法的实验结果进行对比,可以看到利用多尺度进行预测其预测结果RMSE下降了13%;图8为单一尺度和多尺度预测结果,观察图8可看出多尺度的预测误差相较于单一尺度更小,说明多尺度的TCN网络有着更强的非线性表征能力,能够更有效地拟合输入和输出数据之间的非线性关系,更好地表征时域上的特征。
4) 全连接融合结构预测结果
对表3中传统方法(VMD-LSTM-COSA)以及VMD-MTCN-COSA的实验结果与本文方法(VMD-MTCN-COSA-FC)的实验结果进行对比,可知本文方法相较于传统方法RMSE下降了40%,曲线拟合程度提升1.1%;相较于未全连接融合的方法表现也更为优异。图9为全连接融合以及传统方法的预测结果,由图9可知本文方法相较于其他两种方法能够更好的拟合真实的曲线,验证了通过全连接网络对多尺度预测结果进行加权融合,预测结果能够考虑到模态在融合时的相关性以及各自模态的重要程度,能够进一步降低预测误差;说明了本文方法相较于传统预测方法预测表现更为优异。
-
为了进一步对比表3中后6种实验方法,随机选取连续的15个预测点计算平均预测误差,如图10所示,本文方法的平均预测误差为0.332%,传统方法平均预测误差为1.35%,说明本文方法有更高的预测精度,大多数预测点的预测误差相较其他方法更小。预测曲线的拟合程度更高,也说明了本文所提结构用于短期电力负荷预测中可有效降低预测误差。
-
为了验证本文方法有较强的泛化性能,更换一个更大的家庭用电数据集,该数据集以分钟为采样频率,共7维20万组数据,包括有功功率、无功功率、电压等属性,选取其中的10000组有功功率数据进行预测实验。分别采用传统方法(VMD-LSTM-COSA)和本文方法(VMD-MTCN-COSA-FC)进行预测,实验结果如表4所示。从表4中可以看出本文方法相较于传统方法RMSE降低了23%;MAE降低了20%;R2提升1.1%。家庭用电数据集预测结果如图11所示,通过图11可以看到本文方法相较于传统方法可以更好地拟合真实曲线,说明本文方法对不同时间尺度的特征都有较好的表征能力,对不同时间尺度和不同数据量的数据集都有较高的预测精度,较强的泛化能力及较好的预测结果。
实验名称 RMSE MAE R2 VMD-LSTM-COSA 0.224 0.152 0.973 VMD-MTCN-COSA-FC 0.172 0.121 0.984
Multi-Scale Short-Term Load Forecasting Based on VMD and TCN
doi: 10.12178/1001-0548.2021347
- Received Date: 2021-11-19
- Rev Recd Date: 2022-02-25
- Available Online: 2022-07-11
- Publish Date: 2022-07-09
-
Key words:
- short-term power load forecasting /
- subsequence fusion /
- temporal convolution network /
- variational mode decomposition
Abstract: Accurate power load forecasting plays an important role in ensuring the stable operation of the power system. In view of the low precision of traditional short-term power load forecasting methods, the sub-sequence fusion problem is not considered after modal decomposition, this paper proposes a multi-scale short-term power load forecasting based on variational mode decomposition (VMD) and temporal convolutional network (TCN) methods. First, VMD is used to decompose the power load data into several sub-components to solve the problems of non-linearity and randomness in the power load data, then TCN is applied to train several components with different time scales, finally a fully connected network is used to analyze each component. Time-scale decomposition signals are fused to realize short-term power load forecasting and improve forecasting accuracy. The experimental results show that the root mean square error (RMSE) is reduced by 40% and the curve fitting is improved by 1.1% compared with the traditional prediction method of VMD and improved long-short-term memory network.
Citation: | LIU Jie, JIN Yongjie, TIAN Ming. Multi-Scale Short-Term Load Forecasting Based on VMD and TCN[J]. Journal of University of Electronic Science and Technology of China, 2022, 51(4): 550-557. doi: 10.12178/1001-0548.2021347 |