主成分分析和长短期记忆网络的电力负荷预测研究

(整期优先)网络出版时间:2021-10-08
/ 2

主成分分析和长短期记忆网络的电力负荷预测研究

贾鑫龙

神华联合建设有限公司 河南新乡 453400

摘要:文章以电力负荷预测为落脚点,结合现有预测方法,通过集成记忆网络、主成分分析的方式,对全新预测模型进行了建立,该模型有效解决了现有方法无法保证预测精度的问题。在依次对主成分分析、LSTM神经网络、预测模型建立要点进行说明后,通过模拟预测的方式,利用实际数据对该模型的有效性进行了验证,供相关人员参考。

关键词:电力负荷预测;长短期记忆网络;主成分分析


前言:要想使电力系统长期处于稳定运行状态,关键是要做到供需平衡。电力负荷具有明显的非线性特征,对应波动存在一定的随机性。通过研究可知,如果实际用电负荷和预测值存在1%的误差,每年运行电力系统所投入成本就会增加近千万,由此可见,掌握电力负荷变化所遵循规律,对电力负荷进行准确预测十分重要,以现有预测方法为基础,对记忆网络、主成分分析加以应用是大势所趋。

1主成分分析

可给电力负荷消耗造成影响的因素较多,其中,最具代表性的因素为气象因素,基于负荷预测模型所导入要素,主要有历史气象和历史负荷,相关输入特征有内在关联存在。以气象数据为研究对象,利用PCA对其做主成分分析处理,通常能够获得可替代原始数据的主成分,这样做既可使原始数据有效信息得到保留,又能够将可给预测结果造成影响的噪声去除[1]

对原始数据集实际协方差矩阵进行计算的方法如下,将原始数据集设为X,假设X所含历史负荷数据为n条,每条数据对应影响因素为p个,则可得到:

616002ad167b6_html_61e594903f57f67f.gif

616002ad167b6_html_a175ff6ec22e3b65.gif

输入变量对应数据集,其协方差矩阵表示为:

616002ad167b6_html_b51d75a72d302380.gif

对该矩阵所具有特征值λi、正交单位对应特征向量ai进行计算,则可用以下公式,对原变量主成分进行表示:

616002ad167b6_html_2e578294a70dc970.gif

在该公式中,Fi代表原变量的第i个主成分,616002ad167b6_html_40bb3c8c56255a2.gif

将主成分数量设为m,对应方差贡献率、贡献率累计值为:

616002ad167b6_html_1e9076b37d95536f.gif

616002ad167b6_html_e04a8038407bc67c.gif

对主成分相关载荷系数进行计算的公式为:

616002ad167b6_html_86eafe662bf5f9fb.gif

基于主成分m对影响因素得分进行计算,通常可采用以下公式:

616002ad167b6_html_64c285bcb760bd02.gif

若方差累贡献累计率达到80%,则说明主成分m可被用来表示原始数据集所涵盖多数信息,一般情况下,m的取值不应超过p。

2LSTM神经网络

LSTM的优点主要是能够解决传统网络极易出现的梯度爆炸、梯度消失问题。该网络通过对记忆单元进行新增的方式,使对过去信息进行准确记忆和长期存储的设想成为现实,另外,该网络在泛化能力方面的表现较其他网络更为理想,既能够学习较小数据集,又可以学习较大数据集,还可被用来对非线性问题进行高效处理[2]。该网络的结构如下:

616002ad167b6_html_51fc7553ef8c37ca.png

1 LSTM单元结构

遗忘门f1以过去状态Ct-1为依据,对信息去留进行判断。由σ、tanh负责对输入xt进行分析,确定更新数据,在此基础上,对相应候选值进行生成。待数值经过更新运算处理,方可联合遗忘门对单元状态进行更新。经过更新的单元状态用Ct进行表示,Ct通常需要经过tanh、输出门的计算,才能得到相应ht数值并将该数值输出。

3组合预测模型应用

3.1建立模型

3.1.1模型结构

本文所研究PCA-LSTM模型,通常要先处理相关气象数据、负荷数据,再利用PCA法,对可给负荷产生影响的气象数据进行降维处理,待负荷数据、降维所得气象数据完成归一处理,便可向LSTM网络输入由归一数据所构成测试集、数据集,确保预测及训练环节能够得到有序开展。

该模型可分成预测层,训练层,输入层,隐藏层,输入层。先向预测模型输入训练集相关数据,通过反复训练预测模型的方式,使迭代次数达到最大、模型参数符合要求,此时,该模型所取得预测效果最接近实际情况。随后,再向训练模型导入测试集,便可获得最终的预测结果。

3.1.2评价指标

研究人员出于对本文所提出模型是否精确进行有效评估的考虑,最终决定采用RMSE以及MAPE辅助评估工作开展,计算公式如下:

616002ad167b6_html_fd5007a54a02f514.gif

616002ad167b6_html_a761075096434d9d.gif

在上述公式中,616002ad167b6_html_964d056d84f68c43.gif 代表负荷预测值。yi代表实际值。n代表测试集对应样本数据量。结合相关规定可知,若平均绝对百分比所存在误差未达到5%,表明预测方法与应用标准相符,若相关数值未达到3%,表明预测方法具有良好性能,若相关数值未达到2%,表明预测方法有应用价值,若相关数值未达到1%,表明预测方法精准度理想。

3.2实验分析

3.2.1确定实验环境与数据

本次实验环境为8GB内存的处理器,编程语言为python3.7,软件框架为Tensorflow。研究人员出于保证模型精确性验证结果符合实际情况的考虑,最终决定采用建模竞赛所提供数据集,该数据集所涵盖数据类型为气象数据、负荷数据。

3.2.2对数据进行预处理

受数据意识、采集设备故障影响,气象数据、负荷数据均有缺失和异常数据存在,以上问题将给预测精度造成直接影响,提前处理缺失值、异常值很有必要。研究人员将相关数据统一定义为缺失值,通过平均值法使其得到有效填充,在此基础上,对训练集、测试集所涵盖数据进行准确划分。

3.2.3提取气象主成分

主成分分析的对象,主要是可能给负荷产生影响的因素,例如,降雨量,最低/最高温度,空气相对湿度,全年平均温度。在方差贡献率的累计值达到80%时,表明对应主成分可涵盖原始数据多数信息。研究人员将方差贡献率的累积阈值设为90%,结合协方差矩阵将替代原始数据的主成分数量定为2个,强调仅需要向网络导入2个主成分,便可完成后续训练。

为保证网络训练效果达到预期,研究人员提出应先将主成分归一,用0~1的数值进行替代,以免网络激活函数有饱和问题出现。归一化处理所使用公式为:

616002ad167b6_html_d046794f9b54acc5.gif

在该公式中,ug代表归一数值。umin代表数据集内最小数。umax代表数据集内最大数。u代表数据集的值。

3.2.4结果对比讨论

有关人员出于对预测模型所具有精确性加以验证的考虑,先后使用了四种模型进行预测,其中,单一LSTM仅输入电力负荷,复合LSTM输入负荷与气象因素,PCA-LSTM强调主成分分析,分析对象为气象因素,ANN模型同样输入负荷及气象因素,利用RMSE及MAPE对预测效果进行评价,不同模型所给出预测的实际误差如下:

1 不同模型的MAPE值及RMSE

预测模型

MAPE值

RMSE值

单一LSTM

6.03

53250.67

复合LSTM

2.86

20487.26

PCA-LSTM

1.20

8535.62

ANN模型

3.12

21972.59

越小的MAPE值及RMSE值,代表越好的预测效果。结合表1所提供数据可知,单一LSTM对应MAPR值及RMSE值较其他模型更大,这表明气象因素给预测结果所产生影响十分直观,对神经网络进行训练时,有关人员可在输入值中融入气象因素,确保预测精度达到预期水平。

对比复合LSTM与ANN模型的相关数值可知,复合LSTM在预测精度方面的表现较ANN网络更加理想,仅考虑时间序列,神经网络模型的表现与LSTM存在较大差距。先基于主成分分析对气象因素进行处理,再将处理所得数据导入LSTM并进行训练,对应MAPE值显著降低。

结论:本文介绍了以PCA-LTSM为基础、对电力负荷进行预测的模型,该模型强调利用PCA对气象数据做降维处理,在对LTSM模型进行建立的基础上,经由仿真建模对模型精确性进行了验证,最终结果如下:通过对比现有模型可知,气象因素给负荷预测所产生影响极大,对气象因素加以应用,可使预测精度得到显著提高,而对气象因素进行降维处理,一方面可保证数据原始信息得到保留,另一方面可将数据噪声去除,为预测精确度提供保证。

参考文献:

[1]赵会茹,赵一航,郭森.基于互补集合经验模态分解和长短期记忆神经网络的短期电力负荷预测[J].中国电力,2020,v.53;No.619(06):52-59.
[2]魏骜,茅大钧,韩万里,等.基于EMD和长短期记忆网络的短期电力负荷预测研究[J].热能动力工程,2020,v.35;No.233(04):213-219.