基于大数据技术应用的电费收入精益管理研究

/ 2

基于大数据技术应用的电费收入精益管理研究

 冯琴庆 ,赵永超 ,刘伟 ,王敏 ,郑莉

远光软件(武汉)有限公司  湖北武汉  430015

引言

电费收入是电网企业主要的现金流来源,合理预测电费资金流入,对于电网企业合理安排资金收支,在保障资金安全的前提下,创新融资模式、提高资金运作效率和效益、降低融资成本具有重大意义。

传统的收入预测往往是运用数学方法构造出模型进行预测,需要估计具体的参数,并对参数不断修正。由于收入预测涉及技术、管理、经验等方方面面,运用传统预测方法,一些有效信息在建模时可能会被忽略掉。从实际效果来看,传统的电费收入预测结果偏差较大,已无法满足公司现金流“按日排程”的管理需求。

随着大数据技术应用的日臻成熟,更多的电网企业尝试通过数据挖掘和人工智能算法搭建电费收入预测模型,实现科学精准预测。本文结合多个项目实践进行初步探索,希望为电网企业资金精益化管理研究提供一些参考。

1模型构建

电费资金的规模取决于应收电费发行情况,准确预估应收发行数据则是精准预测资金流入数据的前提和基础。结合项目实践,电费收入预测模型建设分为三个阶段:

第一阶段:基于历史应收电费数据规律,通过数据挖掘和人工智能算法,实现每月应收电费数据的合理预测;

第二阶段:深入分析应收电费和电费资金流入的对应关系,分类细化收入中不同类别用户、缴费模式,搭建基于应收电费水平的月度电费资金流入预测;

第三阶段:基于日资金序列周期性特征,测算日系数,将月度资金预测数据分解至每日。

我们抽取某省公司2019年1月至2022年10月的电费账户交易流水、财务报表数据、用电类别、节假日、天气等数据开展研究分析,其中2019年1月至2021年7月的数据用于建模及训练,2021年至2022年8月、9月、10月数据用于验证模型效果。

1.1月度应收电费预测模型

本文采用隐马尔科夫模型进行月度应收电费预测。该模型最初被应用于语音识别、移动通信、基因序列检测等领域,后逐步渗透到各个领域,如股票预测、故障诊断等。与传统的模型相比,该模型没有了复杂的数学模型推导和参数寻优。

隐马尔可夫模型进行电费收入预测,是一个深度学习型算法的应用,其预测过程分为两步,模型训练和实时预测。模型训练是利用历史电费收入数据训练和学习电费收入状态变化规律,本质是预测出电费收入变化趋势的隐藏状态和他们之间的转移概率。月度实时预测采用向前迭代滚动预测方式,步长设置为 1,推出未来某点情况。首先计算出该点转移概率及相应状态,再通过历史数据回归分析得到月度电费收入变化值,在状态序列中获得最符合转移概率和状态变化的观测值,作为实时预测数输出。

利用时间序列、 回归、关联分析、聚类等大数据算法对用户历史用电行为、缴费行为等进行分析、测算,找出与实际电费收入关联性强的影响因素,计算影响权重,对预测结果进行调整。

1.2月度电费资金流入预测模型

月度电费资金流入主要取决于当月发行的应收电费及预收电费余额变动,深入分析某公司2019年1月至2021年7月的应收电费与电费资金流入之间的关系,搭建基于应收电费水平电费资金流入测算模型:

其中,Z为次月的电费资金流入,X为当月发行的应收电费,Y为次月预测的应收电费,a、b为待估模型系数,c为常数。

采用最小二乘法进行数据拟合,通过最小化误差平方寻找最优的模型参数a和b,进而实现基于应收-实收模型的电费资金流入预测。为进一步提高电费资金流入预测的精度,在具备条件的单位,可分用户类别分析计算不同类别用户、缴费模式对月度资金流入贡献,汇总得到次月预测结果。

1.3日度电费资金流入预测模型

根据历史电费流水数据,分析资金序列周期性特征,每月内周度收入序列整体变化呈现出上升趋势;将当月日收入序列按周对齐,每周的日收入序列呈现相似的变化趋势,工作日中周一常为缴费高峰,非工作日缴费规模显著回落;计算工作日与非工作日的日平均缴费规模比值,符合整体工作日和非工作日的缴费规律,日收入序列具备以7天为周期的周期性特征。

根据日资金序列周期性特征,测算出日系数,进而测算出日电费资金流入。根据历史数据训练结果,建立基础分析库,分析日资金特征,找出异常数据及原因,及时调整后期预测数据。

2模型效果

以2021年至2022年8月、9月、10月的数据进行测算,分析对比模型预测效果。

2.1月度应收电费预测结果

基于应收电费预测模型,应收电费预测结果如表1,2021年8月至10月平均偏差4.28%,预测结果相对合理。2022年8月至10月平均偏差5.16%,其中8月偏差高于10%。

表1 2021至2022年8月至10月应收电费预测偏差

年份

8

9

10

均值

2021

2.99%

3.14%

6.71%

4.28%

2022

10.11%

3.58%

1.80%

5.16%

观察历年电费收入月度曲线发现20228月数据异常波动,9月又回归正常历史趋势。考虑高温天气影响,继续分析历史电费和温度环比变化,发现天气与售电正相关,后续可将天气因素作为影响因素进一步分析。

2、月度电费资金流入预测结果

基于月度电费资金流入预测模型,电费资金流入预测结果如表2, 2021年8月至10月平均偏差1.03%,预测结果相对合理。2022年8月至10月平均偏差6.01%,高于5%,后续将结合天气因素进一步优化。

表22021年至2022年8月至10月电费资金流入预测偏差

年份

8

9

10

均值

2021

1.54%

0.03%

1.50%

1.03%

2022

9.11%

5.13%

3.78%

6.01%

3、日度电费资金流入预测结果

基于日度电费资金流入预测模型,日电费资金流入预测结果如图1,2022年9月、10月预测结果基本符合资金序列周期性特征。



图12022年9月至10月日电费资金流入对比分析

3结语

本文阐述了一种基于大数据技术应用的电费收入预测方法,从历史数据验证效果来看,具备一定的参考性。但由于业财数据壁垒,我们目前仍以财务报表、银行流水等作为主要研究数据来源。随着电网企业数据中台的建设推进,相关数据获取及处理分析能力的提高,我们希望能从更多维度解析电费收入数据。

在电力市场化改革背景下,电力商品化属性逐步显现,电价预测日趋复杂,而极端天气、疫情频发等外部因素也增加预测难度,利用深度学习和人工智能技术,有针对性的对公司相关历史数据进行探索挖掘,将系统模型预测与专家经验结合起来,能更好地提升模型可靠性。

对非电业务收入、票据业务量大的公司,需按业务分类细化,建设专门的预测模型,并考虑资金收入中现金、票据的影响,进一步提升预测的准确性。

参考文献

[1] 慈会林 . 构建资金排程模型的思考 [J]. 财务与会计 , 2021(14): 82-83.

[2] 廖凯茵 . 基于因素分析模型的电网企业售电收入预测 分析 [J]. 中国外资 , 2020(4): 77-79.

[3] 张旭东,黄宇方,杜家浩,缪永伟.基于离散型隐马尔可夫模型的股票价格预测[J].浙江工业大学学报,2020(48):148-153.