关于企业数据治理工作的思考

(整期优先)网络出版时间:2023-10-11
/ 2

关于企业数据治理工作的思考

吴鹏

身份证号码:42052719850228005X 

摘要:在数字化转型的背景下,开展数据治理体系建设成为发展数字经济的重要基础。通过对国内外数据治理框架的研究,结合企业数字化转型工作的要求,将数据治理体系建设工作的主要内容归纳为管理组织、数据治理、技术支撑、过程执行、和发挥价值等五个方面,并对相关内容进行了阐述。

关键词:数字化转型;数据治理;数据架构

1


1概况

党的十九届四中全会首次将数据纳入生产要素,中共中央、国务院印发的 《关于构建更加完善的要素市场化配置体制机制的意见》中明确要求加快培育数据要素市场,全面提升数据要素价值。

随着企业数字化转型工作开展对于数据治理作用认识也不断深入。数据作为数字化转型的要素,数据质量高低影响到数字化工作的难易和成本开展企业级数据治理工作,已经成为各领域,各类型企业数字化转型的必经之路通过数据治理实现企业数据资产的沉淀,打造数据驱动业务的能力。

2企业信息化及数据治理现状

公司多年大力推进信息化建设并取得了明显成效。分别在经营管理,工程建设生产运营、综合管理等方面建设应用多个信息系统,为公司的从信息化向数字化转型提供了良好的支撑。

现有数据资源主要包括以下两大部分:(1)经营管理类数据,以结构化数据和非结构化数据为主,非结构化数据包含文本、图片、视频等数据。(2)生产运行类数据,以结构化数据和时序数据为主,覆盖公司生产调度、设备资产管理、管道完整性管理等业务领域。(3)综合管理数据以结构化数据为主。

数据管理方面主要存在以下不足:(1)基本未建立权责清晰的管理组织与制度流程。(2)数据质量管理缺乏标准依据,跨部门的数据沟通困难;缺乏数据质量管理工具支撑。(3)数据资源共享困难。公司的大部分业务系统按业务线垂直建设,限制了数据价值的挖掘。

3数据治理工作主要内容

数据治理体系建设方面可以参考框架(标准)主要有:DAMA(Data ManagementAssociation 国际数据管理协会)的数据治理体系框架;CMMI(Capability Maturity ModelIntegration 软件能力成熟度模型集成)研究所推出的DMM(Data Management Maturity,数据管理成熟度模型);DCMM(Data management Capability Maturity Model)《数据管理能力成熟度评估模型》(GB/T 36073-2018)国家标准。以上框架都会涉及到数据战略数据治理组织(制度、规范数据架构,数据安全,数据质量,数据共享,技术平台等内容。按照管理特点,可以归纳为管理组织数据治理、技术支撑、过程执行、和发挥价值等五个方面

(1)管理组织的工作主要是确定战略、搭建组织、制定制度、明确规范管理,需要做到的是各个业务部门都知悉数据治理的战略,统筹协调各方资源。数据管理组织机构一般包括数据治理领导组,数据治理委员会和各领域数据治理工作组。

(2)数据治理的工作是明确数据治理的对象和目标。根据数据资产的构成,又分为业务数据和分析数据。业务数据管理应具备以下功能:

数据标准建模:具备对象、分类以及关系型数据建模;具备数据编码规范的配置能力;具备属性权限的分配能力;具备属性约束校验能力;具备相似检索配置能力。

数据生命周期管理:具备数据申请、审批、发布、维护、归档、清除全生命周期管理的能力;具备版本控制的能力;具备数据综合检索查询的能力;具备数据批量处理的能力。

数据质量校验:数据申请、审批、发布以及维护过程中具备数据填写规范和约束校验的能力;具备数据相似度检索和查重的能力;数据同步过程中具备数据质量监控和日志的能力。

数据分析指标一般都是业务中最基础的内容,所以在数据治理中分析指标管理也是其中必要的一环。指标管理主要包括:

(3)技术支撑提供数据治理所需的数据架构数据架构、数据治理工具和数据管理平台。包括数据架构管理、数据质量管理、数据安全管理等功能模块。

数据架构管理包括数据资源目录管理、数据标准管理、数据模型管理和数据分布管理四部分。通过建立数据架构,以结构化的方式,描述在业务运作和管理决策中所需要的各类信息及其关系。

数据质量管理以数据清洁为目标,以业务需求为驱动,通过数据质量计划、监控、评估、改进的循环,持续提升数据质量,达到数据质量结果满意,数据质量管理系统化、持续化、常态化

数据安全管理方案是基于数据湖建设而设计,旨在保证数据从数据源入湖到数据共享全过程的数据安全。数据安全管理是对数据设定安全等级,建立完善的体系化的安全策略措施,全方位进行安全管控。

数据共享管理按照统一、集约、高效的数据应用理念,基于数据地图,为用户提供安全可靠的数据资源查询、检索和共享授权申请,按照数据认责结果,执行授权审批,并将审批结果同步至数据湖平台;由数据湖提供数据共享服务。

(4)过程执行主要是方法论层面,数据治理过程包括评估与分析、规划与设计、实施的PDCA循环。在评估与分析阶段要评价现有数据治理的成熟度、风险及合规性,业务对数据治理的需求。在规划和设计阶段,要明确数据治理的目标和任务,制定数据治理的相关制度和流程,设计数据标准、数据模型、数据架构,及数据治理的实施路径。在实施阶段,要制定数据治理的相关制度、流程细节,选择合适的数据治理工具并通过定制化开发来满足数据治理要求

(5)发挥价值:通过实现信息整合和分发机制,支持跨业务、跨部门、信息流通和共享。数据湖进行数据集成的时候,要考虑不同的系统中如何把它们科学地、合理地组织成一个整体,通过自动化的集中管理和数据治理,面向各种业务场景提供数据赋能,从而充分挖掘数据价值,促进数据增值,助力行业用户实现数字化转型。

4研究成果

对国际管道公司的业务和信息系统进行盘点,包括工程建设、生产运行、资产完整性、经营管理四大方面。根据数据梳理得到的结果,通过采用统一的规范标准,对公司的核心业务数据做统一的分类规划,形成数据集合。在数据主题域划分的基础上,可以抽象细化出各个主题域下的数据实体,从而描述出公司运营和管理过程中设计的主要业务概念和相关规则。

基于公司的业务架构及现状梳理,对公司业务数据进行分类,形成12大数据主体域,在此基础上,对各个主体域进行子主题域的划分,并据此对各领域的业务内容进行细化。

5结论

数据治理工作是一个持续性的过程,需要业务部门和技术部门的积极配合,才能构建统一的治理系统和技术平台。在企业数据治理工作中,有几个重要的关注点

(1)数据治理体系建设是首要任务,数据治理作为企业数字化转型的基础支撑,要综合考虑组织机制,标准规范,技术架构等各方面的内容,构筑起全方位的保障措施,保证数据治理工作的顺利实施和逐步深入。

(2)数据治理平台的搭建,需要和企业整体技术架构相结合。数据治理提供数据管理规则与标准能力支撑,从而贯穿数据源到数据应用。

(3)数据治理工作要充分与各业务进行沟通,梳理现有相关系统的数据库,数据流向,各类单据,理清主数据,业务数据,分析指标之间的关系。采用小步快跑的方式,通过持续治理,多次迭代,才能持续输出治理成果,并为后继的数据治理和数据平台建设奠定基础。

参考文献:

[1]《数据管理能力成熟度评估模型[S],2018

[2]刘顺春,《“共享中国石油”中的数据治理体系研究》[J],北京石油管理干部学院学报,2019

[3]DAMA International,《DAMA数据管理知识体系指南》[M], 清华大学出版社, 2012.7

[4]刘银亮,《基于数字孪生的管道数字化平台建设要点》[J],油气与新能源,2021.10

1