基于岭回归方法的燃气轮机最大负荷预测

(整期优先)网络出版时间:2022-07-21
/ 3

基于岭回归方法的燃气轮机最大负荷预测

杨晨

大唐国际发电股份有限公司北京高井热电厂,北京市 石景山区 100041


摘要:为了预测燃气轮机在不同环境工况的最大发电能力,采用机器学习的岭回归方法,以PG9371FB型燃气轮机的历史运行数据作为训练样本,建立关于燃气轮机最大负荷的岭回归数学模型,并对模型进行验证分析。结果表明:基于压气机入口参数的岭回归模型可以对燃气轮机的最大负荷有效预测,且预测误差小于±2%。该方法能够燃气电厂的性能优化和计划营销提供量化依据。

关键词:燃气轮机;最大负荷预测;岭回归;机器学习

1引言

燃机发电机组是适应环保要求和市场新环境的新型发电机组,具有启动快、独立性强、可靠性高等优点,近年来在电力行业广泛应用[1]。随着我国电力市场化改革的逐步推进,市场各方须要更频繁地参与各种电力交易。对于电力供给方的燃气发电厂,须要定时定量地向购电方供应电量,若燃气发电厂的供电无法满足要求,则可能面临考核甚至丢失市场的风险,这也使得预测燃机功率成为燃气发电厂的迫切需求。虽然燃机能够通过运行调整实时改变负荷,但是调节范围不会超过当前环境参数下燃机的最大发电能力,而环境参数对燃机的最大发电功率有显著影响,使得燃气电厂无法通过设计工况参数对燃机最大功率进行实时准确预测,因此对给定环境参数下燃机最大功率进行预测变得尤为重要。

燃气轮机由于技术保密的原因,很多结构和性能数据等资料都掌握在生产厂商手中[2],这对建立燃机物理模型造成了极大困难。而目前机器学习、人工智能等技术的快速发展,为燃机性能预测提供了一条新的道路,即从数据出发,归纳总结数据规律,进而得到自变量与目标变量的预测数学模型。国内外学者已经对电负荷预测的理论和方法开展了大量的研究,包括神经网络[3-5]、支持向量机[6]、小波分析理论[7]等,这些研究主要针对用户侧的用电量进行预测[7-10],而针对电力供给侧燃气电厂的发电能力预测较少,现有的燃机功率预测模型多为基于燃料量、IGV角度和环境参数的燃机功率的多元回归模型[11, 12],这类燃机功率模型的预测前提条件是已知燃料量、IGV角度等数据,而燃气电厂在做性能优化和制定年度生产计划时无法提前预知未来的燃料量和IGV角度等参数的,这时该类模型无法给出功率预测结果。考虑到燃气电厂能够调节负荷从零到最大负荷变化,因此界定燃机的最大负荷更有指导意义。由于燃气电厂的气候条件与上年相比变化不大,天然气热值基本不变,所以可以通过环境参数建立燃机最大功率的预测模型。

针对目前缺少基于环境参数的燃机最大负荷预测数学模型的问题,本文将机器学习的岭回归算法应用于燃气轮机最大负荷预测,以PG9371FB型燃机发电机组的历史运行数据作为训练样本,建立关于燃机最大负荷的岭回归数学模型,并对模型进行优化,对预测精度进行验证,结果表明基于环境参数的岭回归模型能够较好地预测燃气轮机最大负荷。

2问题描述

在燃机实际运行中,在一定的初始进口条件下,燃机的最大负荷基本确定,初始进口条件包括大气温度,大气湿度、大气压力以及燃气华白数。通过岭回归方法建立燃机最大负荷和初始进口条件之间的关系,从而获得燃机最大负荷的预测模型。

本文从某电厂PG9371FB型燃机的历史数据中获得2018年-2019年内96863个工况的实际运行数据,如表1所示,数据集共包括实际负荷和现场能够监测的环境变量:负荷(P)、环境温度(t0)、环境压力(p0)、相对湿度()、华白数(W)、满负荷状态逻辑量(Sbase),上述变量及意义详见表1-2:

表1燃机实际运行数据

Tab.1  Gas turbine actual operating data

数据

序号

P/

MW

t 0/

p0/

kPa

/

%

W/(MJ/

Nm3

Sbase

1

180.2

-1.0

101.13

10.5

44.98

0

2

180.2

-0.9

101.12

11.8

44.98

0

3

182.4

-0.8

101.12

11.5

45.16

0

96861

262.9

30.4

99.249

29.8

45.14

1

96862

263.6

30.2

99.267

30.

45.15

1

96863

262.5

30.0

99.285

29.7

45.14

1

由于原始数据集存在非运行以及故障数据,需要对原始数据集进行筛选预处理。本文的研究目标为满负荷工况功率,所以利用Sbase = 1,筛选出满负荷工况数据,筛选后的样本中负荷(P)全部为对应环境条件下的最大负荷(Pmax),将该数据集作为模型的训练数据。将燃机最大负荷作为目标变量,将环境温度(t0)、环境压力(p0)、相对湿度()和华白数(W)作为自变量,将预测方程假设为:

3相关性分析:

为了明确环境温度(t 0)、环境压力(p0)、相对湿度()、华白数(W)、最大负荷(Pmax)等变量间的相关关系,通过相关系数矩阵来分析特征变量间的变化关系。

图1相关系数矩阵

Fig.1  Correlation coefficient matrix

从图1的相关系数矩阵得出如下定量结论:

  1. 环境温度(t 0)对最大负荷(Pmax)的相关系数为-0.982,为高度负相关关系;
  2. 环境压力(p0)和最大负荷(Pmax)的相关系数为0.876,为高度正相关关系;
  3. 相对湿度()和华白数(W)对最大负荷(Pmax)的相关系数为-0.564和0.245,相关度不高。

通过上述定量分析,在后续的建模过程中,将使用环境温度(t0)和环境压力(p0)作为最大负荷(Pmax)的特征变量,而将相对湿度()、华白数(W)从特征变量中去除,将预测方程简化如下:

4岭回归模型建立及优化

针对基于数据的目标变量预测问题,多采用线性回归的方法解决,其中经典的回归算法为最小二乘法,然而在处理共线性问题时最小二乘法偏差较大,采用改进的岭回归算法能够较好的解决共线性问题,下面对上述两种方法进行简单介绍:

假设X为m个工况下的条件变量,其中m是工况数,n是特征变量个数

n 是 n 次不同状态下获得的条件变量,通过多次独立状态下获得的多个条件变量与目标变量之间的多元线性回归模型有可以写成:

将条件变量和线性参数写成如下形式:

则回归模型的预测值

模型预测值的损失函数表示为:

取得最小值时即时,求得最小二乘法的参数估计为,统计学上可以证明参数θ的无偏性。

虽然最小二乘法能够求出参数的无偏估计量,但对于共线性问题,即矩阵X中存在变量的相关关系及不可逆,此时无法使用最小二乘法求出结果。为了能够让计算过程具有更好的普适性,可以采用岭回归方法,在损失函数中增加正则项,此时损失函数为:

取得最小值时即时,求得岭回归的参数估计值为:

由于为对角阵,一定可逆,显然一定存在α使得可逆,有效解决了不可逆问题的求解,岭回归方法以损失部分信息、降低一定精度为代价获得回归系数更为符合实际、更可靠的回归方法,对病态数据的拟合要强于最小二乘法。

本文的数据处理及建模过程通过python编码实现,其流程如图2所示。

2岭回归建模流程图

Fig.2  Ridge linear regression modeling flow chart

通过上述编程及计算过程,建立的岭回归模型为:

其中Pmax为最大负荷(MW),t 0为环境温度(℃),p0为环境压力(kPa)。

该模型的误差散点图如下图2所示,该模型对测试数据的拟合优度R2=0.951,最大误差约5%。

2燃机最大功率预测值和实际值对比

Fig.Comparison betweenpredicted andactual maximum power of gas turbine

由于实际工业应用要求预测模型的形式尽量简单并且最大误差应尽量小。考虑到环境温度(t 0)和环境压力(p0)间的相关系数为-0.88,为高度负相关,可将预测模型的形式从简化为,同时观察到预测值和实际值在两端的误差较大,可能是由于温度的1次特征无法反映最大负荷真实的变化规律,所以考虑在模型训练过程中添加温度的平方项特征,得到的岭回归模型的表达式为:

3燃机最大功率预测值和实际值对比

FigComparison betweenpredicted andactual maximum power of gas turbine

该模型的误差散点图如下图3所示,对测试数据的拟合优度R2=0.988,最大误差约为±2%,预测准确度有了较为显著的提升,同时该模型特征变量只有环境温度(t 0),较好地满足了工业应用场景对预测模型的准确、简化要求。

5结论与展望

本文根据PG9371FB型燃机发电机组的实际历史运行数据,采用岭回归分析方法对燃机最大功率进行了数学建模,并对数学模型进行验证及优化,结果表明:

  1. 环境温度与燃机最大负荷的相关系数为-0.982,为高度负相关关系;环境压力与燃机最大负荷的相关系数为0.876,为高度正相关关系;相对湿度、华白数与燃机最大负荷的相关系数分别为-0.564和0.245,相关度较低。
  2. 通过岭回归方法建立了燃机最大负荷预测模型为,该模型对测试数据拟合优度R2=0.988,最大预测误差约为±2%。
  3. 把岭回归方法应用于燃气轮机最大负荷预测,是一种新的尝试,但由于不易获得其他型号燃机的运行数据,所以本文仅对 PG9371FB 型燃机发电机组性能进行了分析研究,对于不同型号发电机组的适用性还需要进一步研究。

参考文献

[1]蒋峰, 孙文涛, 李兆明. 略谈影响燃气轮机性能的几个重要现场参数及性能提高途径 [J]. 化学工程与装备, 2014, 000(008): 150-3.

[2]张学镭, 王松岭, 陈海平, 等. 简单循环燃气轮机系统建模及其变工况性能分析 [J]. 动力工程, 2006, (05): 619-23.

[3]KHOTANZAD A, AFKHAMI-ROHANI R, MARATUKULAM D. ANNSTLF-Artificial Neural Network Short-Term Load Forecaster generation three [J]. Power Systems IEEE Transactions on, 1998.

[4]RYU S, NOH J, KIM H, et al. Deep Neural Network Based Demand Side Short Term Load Forecasting [J]. Energies, 2016, 10(1).

[5]YUAN, ZHANG, WEICONG, et al. Short-Term Residential Load Forecasting Based on LSTM Recurrent Neural Network [J]. IEEE Transactions on Smart Grid, 2019, 10(1): 841-51.

[6]谢敏, 邓佳梁, 吉祥, 等. 基于信息熵和变精度粗糙集优化的支持向量机降温负荷预测方法 [J]. 电网技术, 2017, 41(001): 210-4.

[7]沈沉, 秦建, 盛万兴, 等. 基于小波聚类的配变短期负荷预测方法研究 [J]. 电网技术, 2016, 40(02): 521-6.

[8]康重庆, 牟涛, 夏清. 电力系统多级负荷预测及其协调问题 (一)研究框架 [J]. 电力系统自动化, 2008, (07): 34-8.

[9]史佳琪, 谭涛, 郭经, 等. 基于深度结构多任务学习的园区型综合能源系统多元负荷预测 [J]. 电网技术, 2018, 42(03): 698-707.

[10]张素香, 赵丙镇, 王风雨, 等. 海量数据下的电力负荷短期预测 [J]. 中国电机工程学报, 2015, 35(01): 37-42.

[11]黄伟, 常俊, 孙智滨. 重型发电燃气轮机的建模与状态监测研究 [J]. 热能动力工程, 2020, 35(03): 81-6.

[12]刘闯, 金仁瀚, 巩二磊, 等. 多元线性回归方法预测燃气轮机发电机组性能 [J]. 中国电机工程学报, 2017, 37(16): 4731-8+898.