大数据平台的敏感数据保护分析

(整期优先)网络出版时间:2023-11-07
/ 2

大数据平台的敏感数据保护分析

白俊杰 徐博明 田攀俊 刘杰

北方自动控制技术研究所  智能信息控制技术山西省重点实验室,山西太原  030006

摘要:随着信息化社会的飞速发展,大数据的相关应用越来越广泛,伴随的公民个人信息安全保护也被提升到了国家信息安全战略的高度。为此,全国人大常委会和工业和信息化部相继发布了《中华人民共和国网络安全法》和《电信和互联网用户个人信息保护规定》用于保障网络安全,维护网络空间主权和国家安全、社会公共利益,保护公民、法人和其他组织的合法权益。中国移动也下发了一系列大数据安全规范制度,要求加强大数据平台的安全保护能力。

关键词:大数据平台;敏感数据{保护

前言:随着人工智能技术的发展,基于大数据的预测分析技术被广泛应用于各个领域。尤其是近年来新冠肺炎疫情防控过程中,基于大数据的疫情数据分析挖掘技术对排查疫情防控风险点带来了极大的便利,大数据为人们编织了严密的数字网络的同时也把个人信息置于开放式的环境中,使得出现很多起个人隐私泄露的事件,因此,如何在大数据挖掘过程中进行用户隐私或敏感数据的保护成为亟待解决的问题。

1.我国对云平台数据保护提出的管理要求

互联网信息内容审核义务与数据保护要求本来并不交叉,但“平台化”趋势使两者“相遇”出现这种情况的主要原因有2点:一是立法活动不断强化网络平台责任;二是大量数据迁移到云平台上。当互联网信息内容审核义务与数据保护工作面对的是同一个平台时,冲突便由此产生。本文着重从3个方面梳理我国对云平台数据安全提出的管理要求。

1.1云计算服务安全评估制度

我国官方建立的云计算服务安全管理制度可以追溯到2014年。2014年12月30日,中央网信办发布了《关于加强党政部门云计算服务网络安全管理的意见》凶。文件第二条规定党政部门提供给服务商的数据、设备等资源,以及云计算平台上党政业务系统运行过程中收集、产生、存储的数据和文档等资源属党政部门所有。服务商应保障党政部门对这些资源的访问、利用、支配,未经党政部门授权,不得访问、修改、披露、利用、转让、销毁党政部门数据;在服务合同终止时,应按要求做好数据、文档等资源的移交和清除工作。上述文件规定党政部门使用的云计算服务必须通过安全审查,且云服务商不得未经授权访问党政部门数据。这是我国首次对云平台数据安全提出要求,虽然不是面向全社会,但技术原理是通用的。根据形势发展需要,2019年7月2日,国家互联网信息办公室、国家发展和改革委、工信部、财政部联合印发了《云计算服务安全评估办法》切。该文件将此前的党政部门云计算安全审查制度发展为云计算服务安全评估制度,规范对象不再限于党政部门文件要求客观评价、严格监督云计算服务平台的安全性、可控性。

1.2云计算服务安全国家标准要求

为了落实《关于加强党政部门云计算服务网络安全管理的意见》,我国制定了国家标准《信息安全技术云计算服务安全能力要求》 (GB/T31168—2014),明确要求云服务商“严格保护云计算平台的客户数据”。此后,为了支撑《云计算服务安全评估办法》的实施,对该国家标准进行了修订,目前正处于送审稿阶段。送审稿根据《中华人民共和国数据安全法》的要求,增加了“数据安全保护”章节,并要求云服务商“通过与客户签订合同等形式,声明未经客户授权不得收集、使用或处理客户数据”。

1.3信息内容审核与数据保护义务的“冲突”实质

面对云平台上的信息,云服务商既要履行信息内容审核义务,也要履行数据保护义务。前者需要对用户上传的信息进行主动审核,后者需要承诺在授权情况下方可访问客户上传的信息(数据)。两者看似冲突,实则并不矛盾。理解两者关系的关键在于区分以下3点:一是主动审核的信息与需要保护的数据是否为同一类数据;二是在何种情况下信息需要审核;三是在何种情况下数据需要保护。这3点如果区分不清,就会产生类似于“XX文档”事件的纠纷。

2.基于对敏感/隐私数据处理保护用户隐私数据的技术

2.1基于对敏感/隐私数据的访问权限控制保护用户隐私数据的技术

通过对敏感/隐私数据的访问权限控制来保护用户隐私数据在技术层面实现更加简单和灵活,因此,被安全领域用作基础的防护手段。早期代表性的专利有US2012278830A1,该篇专利中,在遇到隐私和保密性时让用户进行控制,并且允许用户表达他们的隐私偏好,允许消费者控制隐私设置;2018年以后的代表性专利有CN110032888A,其根据预设的数据使用权限和数据使用者分类信息,对原始数据设置相应的数据使用权限,提高数据共享开放的安全可靠性;近年来,随着区块链以及算法的快速发展,越来越多的隐私防护技术中借助新的计算机技术实现隐私访问控制的精准性,代表性专利有CN109741803A以及CN112241543A。其中,CN109741803A设置敏感数据的密文访问控制策略,在信息认证、广播、传输过程中,通过数据脱敏和加密,充分保护个人隐私和数据安全;CN112241543A中通过理清数据中台中的敏感数据分布情况以及分类分级情况,实现基于敏感标签或敏感级别的授权访问控制,对敏感数据进行梳理、整合。

2.2基于多方联合计算保护用户隐私数据

的数据在保证数据隐私安全的前提下完成跨组织的联合分析与学习,是近年来发展起来的一种新型的隐私防护技术。代表性的专利有EP3580685A1、CN111967038A、CN112231746A、CN111931221A。EP3580685A1中提出的技术方案用于为由不受信任和/或独立方维护的数据项安全地确定隐私集交集或隐私集交集的特性的方法。隐私数据集的交集是指数据集中的每一个共有的数据项。例如,由几方维护的隐私数据集中表示的相同对象或个人的数据项可以被分类为在隐私数据集中的交集内;CN111967038A通过利用多方安全计算的方式对输入数据和执行代码进行处理以执行计算指令,防止数据泄露;CN112231746A中提供了一种联合数据分析方法,通过镜像等价模型得到关联其多方的特征,在没有相互泄露数据的情况下扩展了分析维度,提高了分析精确度;CN111931221A在不向对方或第三方泄露一方所拥有的数据对象具体的属性数据和特征数据的前提下,根据双方各自拥有的数据对象的第一特征数据、第二特征数据进行联合分组,避免在上述数据处理场景中泄露一方所拥有的数据对象的具体数据。

2.3基于对敏感/隐私数据的识别和拦截保护用户隐私数据

基于对敏感/隐私数据的识别和拦截保护用户隐私数据是被广泛使用的一种隐私防泄漏技术。该技术分支具有领域性特点,不同的领域关注不同类型的隐私/敏感数据类型,代表性的专利有CN111079174A、CN110175623A、CN110020553A。CN111079174A中构建基于匿名化和差分隐私技术的用电数据脱敏算法模型,可以对用电数据进行脱敏;CN110175623A中涉及一种基于图像识别的脱敏处理方法,通过对多个图像识别模型的敏感特征识别结果进行核对来提升敏感特征识别的准确度;CN110020553A保护敏感数据的方法能够确保敏感数据被准确高效地发现和梳理,并对敏感数据的各个出口都进行保护。通过上述分析可知,该技术分支下,不同的领域在隐私防护过程中根据其各自的领域特定确定要识别和拦截的具体对象,从而实现有针对性的精准防护。

3.结束语:

综上所述,大数据是每个企业的核心竞争力,快速高效的大数据处理能力对业务发展和竞争力提升起到巨大的促进作用。大数据平台是整个大数据业务的基石,基石的稳固安全可靠直接影响大数据业务的顺利开展。只有根据实际的需求,通过结合多种技术手段,才能更好地解决不同场景下的隐私保护的问题。

参考文献:

[1]潘明.数据脱敏在公积金系统中的运用[J].现代经济信息,2015,(17):119.

[2]马晓亭.图书馆大数据平台多维度敏感数据保护研究[J].图书馆,2017,(02):70-75.

[3]崔敏龙.商业秘密保护中数据脱敏技术研究[D].西安:西安电子科技大学,2015.

[4]刘明辉,张尼,张云勇,等.云环境下的敏感数据保护技术研究[J].电信科学,2014,30(11):2-8.