基于随机森林的分布式光伏发电量短期预测方法

(整期优先)网络出版时间:2023-05-25
/ 2

基于随机森林的分布式光伏发电量短期预测方法

杨皓

230605199605232815

摘要:针对当前对分布式光伏发电短期发电量预测中数据质量低,进而造成预测结果精度受到影响,使预测结果的平均绝对百分比误差增加的问题,为提升本文分布式光伏发电量短期预测有效性,本文引入随机森林,开展对分布式光伏发电量短期预测方法的设计研究。通过分布式光伏发电输出功率小波降噪处理、分布式光伏发电量影响因素灰色关联分析、构建基于随机森林的光伏发电量预测模型、发电量短期预测,提出一种全新的预测方法。通过对比实验证明,设计方法的数据质量更高、预测结果平均绝对百分比误差更小、预测结果精度更高,在实际应用中具有一定应用价值。

关键词:随机森林;分布式光伏;发电量;短期预测;

中图分类号:TM615文献标识码:A


0引言

近几年,太阳能、风能、生物质能等新能源发电技术得到了快速发展,如何实现对光伏电站各个时期发电量的准确预测,是当前该领域研究人员重点研究的话题。实现对分布式光伏发电量的准确预测能够为分布式光伏发电站的经济化运行和电网运行的安全提供积极作用[1]。同时,当前我国分布式光伏发电站在实现可持续发展的过程中,受到的最主要限制是由于前期规划缺乏全面性,项目在实际运营时产生的成本严重超出预期。因此,建立一个具备更高预测精度的模型对分布式光伏发电量进行预测是促进发电站实现可持续发展的重要手段之一。当前,现有预测模型及预测方法在实际应用中会受到光伏发电输出功率中干扰信号的影响以及预测模型自身因素影响,使得最终得出的预测结果与实际不符,得出的预测结果不具备实际应用价值[2]

1基于随机森林的分布式光伏发电量短期预测方法

1.1分布式光伏发电输出功率小波降噪处理

在分布式光伏发电站中,由于电力设备及相关辅助设备众多,其在运行的过程中会产生一定的干扰信号,对发电输出功率进行采集时会影响到采集的精度。同时,光伏发电的特点也使得其输出功率极易受到外界干扰的影响,在标准的时域范围内会出现不稳定性和波动性等特点[3]。通常情况下,发电站的输出功率存在着间歇性特点,在对其进行预测的过程中还需要结合其所在地理位置,并对发电输出功率的采集时间进行设定,确保在最合理的时间段实现对分布式光伏发电输出功率及相关电站运行数据的准确采集[4]。光伏发电的特点与其他功率相比具备明显的周期性特征,并且发电站在每天发电输出功率的变化幅度也均为先增加后降低。因此结合这一特点,可进一步确定出在当前中输出功率的峰值[5]。除此之外,光伏输出功率的变化曲线在受到干扰因素的影响后会出现明显的波动性,并且其功率的变化也同样会受到外界干扰的影响,因此无法实现平滑、稳定,对于后续预测造成严重影响。因此,避免输出功率中噪声以及其他干扰因素对获取预测数据的影响,进而造成最终预测精度不符合要求的问题产生。

1.2分布式光伏发电量影响因素灰色关联分析

由于分布式光伏发电量会受到多种因素的影响,因此为了确保对各个影响因素分析的准确性,本文引入灰色关联分析方法,利用这一分析方法对各个与发电量有关的影响因素进行分析,并从众多影响因素当中选择出具备较强关联性的因素,将其作为关键特征,并生成后续基于随机森林的光伏发电量预测模型能够识别的训练集。针对所有影响因素的灰色关联度进行计算,并在计算完毕后求取平均灰色关联度,将超过平均灰色关联度的影响因素作为关键特征因素,将未超过或与平均灰色关联度相同的影响因素舍去,以此得到的所有关键特征因素均为与分布式光伏发电量存在较高关联性的影响因素。将这一部分因素汇总,并将其作为训练样本数据导入到下述构建的基于随机森林的光伏发电量预测模型当中,对模型进行迭代训练。

1.3构建基于随机森林的光伏发电量预测模型

随机森林作为一种分类器模型,与其他模型相比具有极强的非线性曲线拟合能力,并且其特定的结构能够使模型在对时序序列数据进行处理时具备更大的处理能力。为了能够避免预测模型在实际应用中出现过拟合现象,利用随机森林对预测模型进行优化,结合随机森林当中的多个分类回归树,对预测模型得出的结果进行投票,并将投票结果输出,根据输出结果确定预测模型是否出现了过拟合现象。

在小波降噪时,同样按照本文上述操作完成对获取到的发电功率信号进行小波降噪处理。将影响因素与经过降噪处理后的发电功率汇总,并完成对模型训练和测试集的构建。为了避免模型在训练过程中消耗大量时间成本,造成预测效率降低,为预测模型搭建一个浅层的BLSTM神经层。在这一结构当中,模型的收敛更加容易,因此促使其训练时间不会过长。浅层的BLSTM神经层与上层LSTM层和下层LSTM层进行连接,以此实现各个层次结构的相连,确保数据的顺畅传递。在模型完成收敛后,经过构建的浅层BLSTM神经层实现对序列的处理,并将所有经过处理的结果作为预测模型的输出结果,得到最终的发电量的预测结果。

2对比实验

2.1实验准备

在本文上述论述基础上,为了实现对本文预测方法在实际应用中效果的检验,选择将其应用到某光伏发电站当中,并针对数据质量以及预测结果的精度进行评价。为了确保实验具备可比性,选择将当前分布式光伏发电站当前针对短期发电量预测的基于LSTM算法的预测方法(文献[2]方法)作为对照组,将本文提出的基于随机森林的预测方法作为实验组。将分布式光伏发电站近两个月的运行数据作为实验数据,每天针对数据采集的时间为早6:00到晚8:00,数据采集的间隔时间为15min,每天采集数据量约为100MB,数据量每日累计计算,两月总共得到数据6000MB。将采集到的数据中历史功率及各个影响发电量的因素作为训练数据。将该组数据作为依据,分别利用实验组和对照组两种预测方法对数据采集日期后五天的光伏发电量进行预测。为了确保实验的客观性,针对上述获取到的实验数据,在进行两种方法预测前,均对其进行统一的归一化处理,以此促进两种预测方法中模型的训练速度提升,从而便于更快得到实验结果。

2.2数据质量对比

在上述实验准备基础上,首先针对两种预测方法输入数据的质量进行对比。实验组和对照组两种预测方法都需要在预测模型的支撑下实现预测,为达到理想精度的预测结果,首先需要确保输入到模型中数据的质量。因此,通过对数据质量的对比能够初步实现对两种预测方法应用适应性的比较。在实验数据当中,每隔十天进行测试,分别按照两种预测方法中的处理方式对数据进行处理,并将数据的降噪效果作为数据质量评价依据。

2.3预测精度对比

通过上述论述,实现对实验组和对照组两种预测方法中数据质量的对比后,再针对其得到的预测结果精度进行比较,按照上述公式,针对数据采集日期后五天的光伏发电量预测结果的平均绝对百分比误差进行计算。在实验过程中,由于本文提出的预测方法应用了随机森林,因此能够在变量不断增加时,仍然能够保持预测结果精度。

3结束语

概而言之,针对分布式光伏发电量的短期预测对于实现发电站的可持续发展而言具有十分积极的作用,因此本文通过引入随机森林提出一种全新的预测方法,并通过实验的方式验证了该预测方法的数据质量以及预测精度。未来发电站中实现光伏发电的设备类型及数量将不断增加,对于预测方法而言进一步增加了其预测难度,为了保证预测结果的精度,在后续的研究中还将针对多种不同设备运行中对发电量的影响进行探究,从而促进预测精度的提升,也为发电站的运营提供更可靠的数据依据,从而始终将发电站运营成本控制在预期可控范围内,在确保发电站经济性的同时,也实现对电力资源的合理利用,提升其社会效益。

参考文献

[1]赵晋斌,张建平,毛玲,等. 基于PSO-Soft attention双向LSTM算法的光伏发电量预测研究[J]. 智慧电力,2022,50(03):1-7.

[2]方鹏,高亚栋,潘国兵,等. 基于LSTM神经网络的中长期光伏电站发电量预测方法研究[J]. 可再生能源,2022,40(01):48-54.

[3]张成,白建波,兰康,等. 基于数据挖掘和遗传小波神经网络的光伏电站发电量预测[J]. 太阳能学报,2021,42(03):375-382.

[4]戴宝赋,胡天,谭建军,等. 基于SWOA优化BPNN的光伏电站发电量预测[J]. 湖北民族大学学报(自然科学版),2021,39(03):321-325+331.

[5]马庆虎,李晓峰,白卫刚,等. 背景反射率对采用不同支架安装方式的双面单晶硅光伏组件发电量的影响[J]. 太阳能,2020(10):59-62.

[6]马庆虎,王珣,白卫刚,等. 降低光伏组件最佳安装倾角对光伏发电系统发电量影响的研究[J]. 太阳能,2020(11):62-65.