电费回收风险预测的大数据方法应用付晨

(整期优先)网络出版时间:2019-10-30
/ 2

电费回收风险预测的大数据方法应用付晨

付晨

(国网河北省电力有限公司任丘市供电分公司河北任丘062050)

摘要:目前,电力营销管理系统主要是由人工从营销管理系统导出电费明细、欠费明细等数据,根据催收策略实施一级、二级、三级催收工作,浪费的人力、物力资源大,催收工作效率低下,并且只能被动的在事后进行电费催收工作。运用大数据技术对大客户电费回收风险进行分析预测,及时发现存在的电费回收风险点,通过营销策略调整降低风险,有效提高电费回收率,提升电力企业经营效益。

关键词:电费回收风险;风险预测;大数据方法;应用

1引言

电力电费回收风险预测系统采用先进的信用风险量化分析技术,通过构建信用等级评价和欠费风险预测数学模型,及时科学的预测电力大用户是否发生欠费和评价电力大用户的信用水平,最终能给出相应的电费回收风险预警等级,为供电企业信息化、智能化营销管理提供有效地辅助工具。

2电费回收的风险因素

2.1用户信用因素

客户故意拖欠电费,存在故意坏账的风险。很多个体经营用户,法制观念浅薄,忽视了按时缴纳电费的重要性,在用电企业催收电费的过程中拒绝与电费回收人员见面,有的企业行为及其恶劣的,甚至会对电费回收人员进行言语的谩骂和驱赶殴打等恶劣行为。存在一部分用户抱有侥幸心理利用电费管理漏洞,只要不停电,尽一切可能的拖欠电费;存在部分经营困难的企业用户,通过变更企业名称或企业法人的手段利用法律漏洞漏缴电费;存在企业恶意利用政府招商引资给出的电费减免政策,少缴甚至不缴电费,给有关供电公司带来了巨大的损失。

2.2外部环境因素

在当前电力市场的发展状态下,外部受环境的影响国家进行企业支持,使得电力市场作为一种公益性的方式,为国家创新型企业发展提供支持和动力。供电企业在现在市场经济的环境下,使得供电企业电费回收存在内忧外患的市场位置。对供电企业电费回收存在着大量的不安环境,不利于供电企业电费的回收。为了社会发展和完善城市建设,对城市的规建将部分地区拆迁,拆迁前电费的结算情况直接影响供电企业的电费回收。一般情况在城市建设和绿化占地必要拆迁原因,更增大了供电企业电费回收的难度和状况。以上等原因使得供电企业很大一部分的电费无法正常回收到固有资金和电费利益的回收。诸如此类的现象还有大量存在着,这使得供电企业在电力回收时面临各种风险,也包括企业的倒闭和延缓缴费,都对供电企业有影响。

2.3政策法规因素

国家为支持创新产业的企业发展,为其争取更小的创业空间和阻碍,使得为其企业进行减负,但政策的制约却影响了供电企业电费回收。许多创业型企业在初期,有着较为困难的资金运行,为了大力支持和拓展企业的发展,在出现供电矛盾和发展时,企业会向政府请求支援,政府为了帮助企业成长和发展,不得不对供电企业进行政策协调。然而,这样的状况就使得供电企业的处境相当的尴尬,供电企业不能够将合理的电费回收,给供电企业电费回收带来了风险。

3电费回收风险预测的大数据方法应用

3.1大数据分析构建模型

本文致力于从用户的各类信息和历史行为中发现其拖欠电费的规律,据此预测用户是否能够按时交纳电费,因此为二分类模型。常用的分类方法有Logistic回归、广义线性模型等统计分析方法,也有决策树、人工神经网络、支持向量机等机器学习方法。其中Logistic回归模型是常用的风险评估模型,也是二分类问题中应用最为广泛的方法。目前,Logisitc的主要用途有2种:某事件发生的概率预测以及寻找事件发生的主要危险因素。本文选用此模型的主要原因有:第一,本研究的预测变量既有连续型变量,也有有序分类、无序分类变量,而Logistic回归模型的预测变量可以为以上任何类型;第二,本研究的预测变量涉及到用户的基本属性、用电行为、历史缴费表现、电费信息等多个方面,既有静态变量,也有动态变量,且变量间的相互关系复杂,变量取值规律多样,而Logistic回归模型从原理上未对变量分布进行假设,因此对模型变量的取值分布要求宽松,且其能够较好地规避回归中的异方差性,并可以通过逐步回归的方法在自变量相关性计算不准确的情况下较好地规避多重共线性问题,能够满足本研究的变量复杂性要求。此外,Logistic回归模型表现稳健,且可解释性好,用于业务应用分析较为适合。Logistic回归预测基本原理为:构建一个因变量代表一笔电费不能及时缴纳的概率,对其进行预测计算;再基于一个阈值,将预测出的概率与阈值进行比较,若不能及时缴纳的概率高于该阈值,则判断为不及时缴纳,反之则判断为及时缴纳。而这一概率变量与各预测变量之间的关系可以使用线性概率模型、Logit模型、Probit模型等不同回归预测模型来构建。

3.2数据准备

以2017年1—6月某市区目标客户数据作为基础数据,以2017年7月和8月是否产生违约金作为目标变量,开展模型训练。基础数据主要包括如下几种。基本属性:用户编号、供电单位、抄表段号等。用电数据:用户分类、行业分类、供电电压、合同容量、负荷程度等。用电行为:用电量、电费、违约金金额,欠费次数、计费次数等。缴费行为:缴费方式、缴费变更次数等。

3.3模型效果

根据模型命中率、覆盖率和提升度3个维度画出模型效果评估图,如图1所示,随着高风险用户得分阈值的增大,命中率和提升度逐渐增高,覆盖率逐渐降低。在图1中,覆盖率和命中率交叉点的位置为收益平衡点,即在交叉点处,考虑营销成本的情况下,可以达到收支平衡,在交叉点左侧,命中率高于覆盖率,在考虑营销成本的情况下,投入更少的资金可以获得更好的收益;在交叉点右侧,命中率低于覆盖率,在考虑营销成本的情况下,想要获得更好的收益(效果)需要更多的成本(措施)。因此,在考虑营销成本的情况下,建议将评分卡得分在90分以上的客户定义为高风险用户,此时的命中率为22.8%,覆盖率为4.1%,提升度为15.4。在不考虑营销成本的情况下,建议将评分卡得分在70分以上的客户定义为高风险用户,此时的命中率为11.4%,覆盖率为26.3%,提升度为7.7。同时将2017年7月和8月数据作为试验集,通过模型验证,得到如下结果:将90分以上的客户定义为高风险用户,在考虑营销成本的情况下,此时的命中率为21.3%,覆盖率为3.6%,提升度为13.9;在不考虑营销成本的情况下,命中率为11%,覆盖率为25.4%,提升度为7.5,与训练集得到的结果基本一致。

3.4应用场景分析

电力企业电费风险预测主要是通过大数据技术实现对用电客户信息的收集、风险识别、风险分析、风险预警,建立电费回收风险评价—风险控制—风险后评价的闭环管理体系。(1)风险评价:通过全面收集客户电费风险相关数据,量化风险发生的可能性,对客户电费回收风险进行评级,进行电费风险评估。(2)风险控制:根据用电客户风险评价体系的评价结果,根据风险程度高低采取差异化的电费回收措施。(3)风险后评价:对风险管理效果进行科学的评价,并生成相应的报表,同时对电费风险成恶化趋势的用电客户按照行业、区域、用电类别进行分析和评价,对相关联用电客户群体进行电费风险趋势评估,在相关联范围内进行相应的风险提示。

4结束语

利用大数据技术进行数据挖掘和建模分析可以对未来业务进行及时预测,便于有效管控风险和采取针对性措施。本文将逻辑回归模型的运用加以完善,将入模指标加以细化,具有较强的适用性和扩展性,可针对抄表员、管理人员等不同岗位职能设计标签及应用场景。

参考文献

[1]涂莹,林士勇,欧阳柳,黄金.基于市场细分的逻辑回归模型在电费回收风险预测中的应用研究[J].电力需求侧管理,2016,1804:46-49.

[2]夏洪涛,施永益,凌卫家,李玮玮,李懑君,赵悦,赵燕波.电费回收风险预测模型研究与实践[J].电力信息与通信技术,2016,1408:58-63.

[3]赵永良,秦萱,吴尚远,付鑫.基于数据挖掘的高压用户电费回收风险预测[J].电力信息与通信技术,2015,1309:57-61.