数据脱敏技术在电力信息系统中的应用

(整期优先)网络出版时间:2017-12-22
/ 2

数据脱敏技术在电力信息系统中的应用

曾明霏谢朋宇

关键词:电网数据脱敏数据库信息系统

由于南方电网公司集约化信息处理的要求日益严格,数据库规模的日益扩大,电力信息系统的不断完善,数据安全问题的解决便提上议事日程。数据脱敏作为数据库安全技术之一,其需求也随之增强。本文论述了数据脱敏技术在电力信息系统中的应用,在应用过程中所采用的方法以及产生的影响是本文探讨的重点。

1.数据脱敏的概述

1.1数据脱敏的概念

在脱敏规则的指导下,运用有效的方法使某些敏感信息完成数据的变形,这一过程我们称之为数据脱敏。数据脱敏的主要目的是对用户数据信息实行保护,提高数据信息的安全度。这样,就可以在生产环境,外包环境以及非生产环境中使用各种安全数据。在一定程度上,进行脱敏后的数据既维持了原有的真实性,又剔除了数据运用过程中的某些安全隐患。

数据脱敏又有人称之为数据漂白或数据去隐私化。生活中数据脱敏的例子随处可见,比如我们的个人消费单上的银行卡号只保留后四位,火车票上的身份证号码中间数字用星号代替,还有某些社交平台上的个人照片打上了马赛克,这些现象都可以算作数据脱敏。

1.2数据脱敏的目的

数据脱敏的主要目的是对数据进行加密,防止泄露,保证信息的安全性。脱敏的数据可能涉及到用户的安全数据或者某些敏感数据,特别是在商业交易中,数据的敏感程度会达到最高,而数据脱敏就是运用适当的方法将这些数据的敏感度降到最低。

脱敏方法的有效性直接决定了数据的脱敏程度,使用不同的脱敏方法,会导致原数据的修改范围的不同,如果修改过多,容易丢失大量数据,难以确保数据的真实性。因此,在选择脱敏方法时一定要根据实际情况来选择最合适的脱敏规则。

2电力数据系统里的脱敏规则

2.1电力信息系统简介

电力信息系统涉及的范围很广,包括:人资系统、财务系统、资产系统、GIS系统、协同办公系统、营销系统、4A等。所有的数据都纳入了电力信息系统数据库中。

电力数据的分析和运用一般采用电力大数据技术。

电力大数据的建立基础是信息技术的完善,各种数据在互联网紧密相连的前提下,通过电力大数据技术的挖掘和统计,整合后的数据运行速度快,精准度高。同时,对数据的保密性要求也随之提高。

数据脱敏技术的出现正满足了电力行业数据处理的需求。电力大数据对电力数据进行分析核算之后得到的新数据,在可视化展现之前,必须要通过数据脱敏技术进行加密,这样才能保证各个用户的信息安

全。

2.2电力数据系统里的脱敏规则

根据实际场景来选择脱敏规则是进行数据脱敏的基本要求。

按照脱敏规则,数据脱敏可以分为可恢复性脱敏和不可恢复性脱敏,这两者也可以称为可逆加密脱敏和不可逆加密脱敏。可逆加密脱敏即是更改数据之后还可以通过其他的方法恢复数据,而不可逆加密脱敏则不可能将数据恢复到原来。

在电力信息系统的大格局里,更改电力系统数据库里用户的个人信息,例如身份证号,手机号,住址等都是最直接有效的数据脱敏方法。这些脱敏方法都属于脱敏规则里的可恢复性脱敏,进行可恢复性脱敏后的数据通过代码的修改也可以恢复到脱敏前状态。

除了脱敏规则之外,脱敏数据和应用场也是数据脱敏的两大关键点。脱敏数据就是指电力数据系统里的用户数据,应用场即是脱敏技术应用的实际场景。

2.3数据脱敏在电力信息系统中应用的必要性

电力信息系统中积累了大量的用户个人信息,包含账户,私人住址等敏感信息,如果这些信息一旦发生泄露或者损坏,后果将不堪设想。国家也发布了相关政策对用户信息进行保护,所以,数据脱敏技术在电力数据系统中的应用势在必行。

数据脱敏技术不仅可以对客户资料信息进行完善的保护,也确保了电力数据在非生产环境下的安全性。脱敏将数据通过某种算法演变成另一种模式,而这种模式既是可读的又是可视的,则说明数据脱敏技术在电力信息系统中的可行性极高。

3.数据脱敏的方法

3.1数据脱敏的方法介绍

数据脱敏的方法有很多,特别是在实际生活中,各种形式的数据脱敏应接不暇。

但在广西电网的电力信息系统中,庞大的信息库里存放着数以万计的用户信息,针对这些用户信息,常用的数据脱敏方法如下:

(1)替换。为防止用户的隐私泄露,可以将电网数据库里的所有女性用户名替换为F,这种方法是最初级的数据脱敏,对于内部人员或信息技术专业人员而言,这种方法只能算得上简单的障眼法,轻而易举就会被破解。

(2)重排。这种方法可以应用于广西电网的海量电力信息系统中,电力大数据里品目繁多,用重排的方式将用户序号重新排列,确保用户信息的安全,这种方法操作起来比较简单,时效性强。但是,同替换法样,这类方法易破解,对于大型的数据库而言,保密性有所欠缺。

(3)加密。对用户信息进行加密,此种方法的应用范围最广,一般的数据应用系统中都会用这种方法对用户信息进行脱敏,这种方法的核心在于所运用的加密算法,加密算法的完善程度决定了数据脱敏的安全程度。

(4)截断。将用户的个人账户中的部分信息进行截断。例如身份证号码截断为前3位。“截断”主要是运用舍弃必要信息的方法来让原始数据变得模糊最终实现数据信息的安全。

(5)掩码。火车票上中间数字用星号代替就是一种典型的掩码方式,同样,在广西电网的电子商务平台上的用户号码的某些数字用特殊符号代替也是运用了掩码这种数据脱敏方式。

3.2数据脱敏在电力信息系统中应用的案例分析

广西电网的数据系统中蕴含了在线监测装置的后台数据,这些数据采用重排的脱敏技术之后,使其保密程度增强。从而有利于运维人员在室内进行实时分析和诊断,不仅提高了工作效率,也减少了酷暑严寒户外工作的机率。

广西电网的电力信息系统里所占比率最大的就是用户信息。用户信息中的个人住址信息,联系方式和账户信息都属于敏感信息。这些敏感信息采用的脱敏技术均是掩码法,例如,用户名称:李**联系方式:131****3321等等。

掩码的要点是保持信息长度不变,这种方式在电力大数据的管理中应用的最多,一是因为它操作起来简单方便,可以让用户界面看起来清晰明了;二是用掩码这种方式变换的数据信息对于信息的持有者而言,更容易辨别。

通过以上两个例子可以表明数据脱敏在电力信息系统的应用中具有十分重要的作用,这种作用不仅只限于保障用户的信息安全,而且对提高整个电网的工作效率都是十分有利的。

4.总结

随着科技的进步,信息技术的不断发展,不少大数据脱敏项目已经研发成功并投入到实践当中,采用大数据平台技术实现海量数据的脱敏将成为下一个数据脱敏技术的风向标。智能匹配算法弥补了现有数据脱敏技术无法将脱敏对象马上识别的缺陷。在电力信息系统中也会将智能匹配算法大力推广,这样电力信息系统中的敏感数据就会智能识别出来,最终实现数据的快速脱敏。

参考文献

[1]邢宇恒,张冰,毛一凡.数据脱敏在海量数据系统中的应用[J].电信科学.2017.

[2]陈毅波,陈乾.基于大数据技术的电网运营分析决策系统研究[J].电力信息与通信技术.2015.