油田开发数据质量评估研究与应用

(整期优先)网络出版时间:2023-12-04
/ 2

油田开发数据质量评估研究与应用

吕慧樊琳李莉莉

大庆油田有限责任公司第九采油厂

摘要:大庆油田数据库历经多年建设,已形成了相对成熟完善的油田开发数据体系。但在数据库建设与数据应用过程中,最大难题是对数据“质量”的管理。九厂油田开发数据库由于历史资料缺失、数据标准变更、评价方法效率低、质量控制体系不健全等原因,开发数据还不足以支撑智能油田的系统应用。本文以油田开发数据为核心,从数据质量的检查标准、及时性、完整性以及准确性方面进行分析,制定数据质量的控制标准、管理策略和应用服务,最终实现油田开发数据的全面管理和精细控制,有效提升数据质量。

关键字: 数据质量;数据评估;开发数据

1引言

随着油田的不断发展,开发数据库也在不断发生改变,由此也产生了好多典型现象。因为油田数据都是随着业务走,专业部门拥有数据,形成多个部门管理数据,使得数据“碎片化”;不同时期、不同合作商开发多个应用系统,并采用不同的数据格式、开发语言和数据库系统,导致油田企业数据管理与数据库五花八门,使得数据“孤岛化”;数据多样化,缺少统一标准,数据集成应用困难;数据生产部门多、数据使用部门广、数据管理部门因为管理机制等问题导致数据应用不畅,效率低下。

油田行业虽形成了大数据,但数据共享应用有难度,尤其还存在数据基础工作没有完善、无法支撑高级应用等问题,因此有必要开展大规模的数据质量评估研究。

2数据质量研究的对象

近几年来,中石油相继建成了A1、A2、A4、A7等几个系统,包含、2\势                                                                                                                            日产生产数据、作业数据、工艺数据、油田监测数据、地面工程数据、勘探开发地质数据等,底层数据采集基本完善。

2.1数据中心体系

九厂数据中心包含油藏工程、采油工程、井下作业、油田监测、地面工程等各类数据库按照应用分属于油气开发和经营管理两类。数据库遵循分布存储、集中共享的原则,已经在逐步完善和校准,但在应用过程中发现已建数据库还不能很好地满足科研、生产的需要,各单位各部门数据统计管理情况参差不齐,缺乏统一标准,甚至一些数据还在采用EXCEL手工方法统计、汇总、分析,导致统计分析周期长,分析结果准确性、共享性差,工作效率低,并且很难发现数据中隐藏的规律以发现生产中的问题,一定程度上制约了油田生产管理水平的提高,未能全面实现信息资源的共享。

2.2数据质量研究对象

目前九厂的开发动态数据主要包括油水井日数据、月井史数据以及相关衍生数据,主要由A2系统产生,以EPDM数据模型存放,由于许多早先开发的软件系统访问的是大庆油田公司的数据存储结构--《开发数据应用结构》,为了满足这些系统的应用,需要及时将开发动态数据从EPDM模型结构回迁到公司的结构规范,但由于受到网络、系统服务调整以及其它原因,会存在数据回迁不及时、不完整等问题,造成同一数据在不同模型存储时数据不一致。

数据质量研究以油田开发数据库为核心,以EPDM模型为突破,支持质量控制标准管理,管理质量控制策略,部署质量控制服务,实施节点质量控制,进行质量分析评估,支持问题跟踪反馈,以全方位多维度报表监控数据资源、质量、管理现状与进展,支持大庆油田在数据库设计、开发、部署、实施、建设、应用、监控、管理、应用、反馈全过程的数据质量管理工作,实现油田开发数据质量的全面管理和精细控制。

3数据质量评估方法研究

数据质量是建设智能油田的必要条件,我们在建设数据池的时候,一定要确保数据池内数据的质量符合未来智能分析的要求,保证数据的正确性。

数据池内的数据纷繁复杂,每一类、每一项数据都应该有其相应的数据标准,只有建立的相应的标准,我们才能判断数据质量是否符合要求。对数据质量的评估可以从数据标准一致性、数据完整性、数据及时性和数据准确性四方面着手。

3.1数据质量评估标准

数据标准的变更和数据质量标准的缺失是大庆油田数据库建设历史中普遍存在的现象,部署全面数据质量管理,实施精细数据质量控制则是根本解决数据质量问题有效途径,是避免新数据成为历史数据问题的根本措施。

通过制定统一的数据质量评估标准库,数据质量报告、报告推送功能来完成数据质量的评估。核心是数据质量标准,与业务相关的标准需要技术人员和业务人员共同确定检查规则,然后编写规则脚本。定时批量执行检查规则,及时发现数据质量问题,将数据质量报告第一时间推送给业务人员,有助于及时纠正问题数据。                                

在油田公司开展的开发数据库建设及应用调研工作的基础上,针对不同数据表,建立个性化的检查规则,继续进行开发静态数据库检查。动态数据方面,主要是公司统建A2系统产生的油水井日数据、月井史数据以及相关衍生数据,由于业务需要,从A2系统的数据结构转储到开发数据的逻辑结构,因此我们从数据的及时性、准确性来保证数据的及时完整;静态数据方面,主要从表间逻辑、表内逻辑方面进行数据质量检查。

制定标准的数据字典模板和数据质量标准模板,支持数据管理人员完成数据结构标准和数据质量标准以及其他相关数据管理信息的数据维护。

3.2数据及时性

数据及时性需要保证同源或跨源的数据是一致不冲突的。

数据在回迁过程中,存在回迁程序已执行,但是当日数据并未成功回迁的情况。如果数据未能及时回迁,会影响九厂自建项目的应用效果,需要根据动态数据回迁时间表,设定触发器定时检查数据回迁情况和及时率,用于监控每天数据的回迁情况,及时发现回迁问题。 根据动态数据回迁时间表,生成检查公报,记录数据的变化情况。

4结论

通过数据质量标准的建立和评估结果的整改,可以有效解决一定范围内的数据共享和集成问题,使数据的录入、同步、查询等效率成倍提升,取得了显著的效果,提高了数据库的高可用性和共享程度,。

数据质量评估的目的是保持开发数据库平稳运行、保证公司级数据共享、促进数据标准化建设,为下一步数据治理做准备,为实现油田管理智能化提供助力,推动油田企业的发展。

5参考文献

[1] 李清辉 , 曾颖 . 油田数据中心建设及发展方向探讨[J]. 石油工业计算机应用 ,2005(3).

[2] 王利君.智能油田建设中的关键技术研究与应用[J].中国管理信息化 ,2017(7).

[3] 李园园,胡璐.智能油田的数据治理工程及应用技术研究[J]. 中国管理信息化 ,2019(10):72-73.