近年来,冀东油田将推进数据资源建设放在首要位置,完善和深化智慧化油田建设顶层设计,应用了“数据湖”框架体系,深化数据资源治理,完善数据中心主库,打通专业数据“入湖”通道,数据治理工程已完成70%。构建跨系统、跨专业数据共享,应用集成体系,提升管理效率。
开启“数据湖”应用新时代
如何获取、处理和使用数据来创造效益,借助数据探索引领企业发展?这一难题摆在信息中心全体人员面前,他们围绕“如何管理数据”和“如何使用数据”,进行顶层谋划。
信息中心从制度上,加强对源头数据的管理,引入PDCA管理模式。从规范上,继续推进非结构化数据治理工作。从业务上,建立勘探开发全息数据采集系统,加强数据质量技术管控。从服务上,完善数据中心主库,深化数据共享服务,加强用户行为审计。
信息中心提出了由“数据湖”为企业提供数据服务,开启了数据应用的新时代。“数据湖”是以原生格式存储数据的方法,对企业中所有结构化、半结构化、非结构化和二进制数据进行统一存储,可以利用机器学习技术和算法进行建模。
通过两年的时间,截至3月2日,信息中心已完成钻井、录井、测井、井下、分析化验、动态监测专业库技术成果类数据的集成和需扩充的生产动态数据的梳理,编制数据同步接口12类112个,A1、A2、A5系统中的核心数据已全部入“湖”,其中结构化数据63类784.2731万条,非结构化文档数据17类1.1773万个。
规范数据资源建设管理
3月1日,信息中心数据管理室员工李旭和赵淑颖利用技术手段精确定位数据质量。他们制定质控规则1830条,实现核心数据的自动质量扫描、数据质量报告的自动生成,变“人工随机抽查”为“全库自动扫描”,精准定位错误数据,为数据的快速整改提供了依据。
多年的信息化建设,冀东油田相继建设完成84个应用系统,积累了海量宝贵数据,但各系统之间存在主数据不一致、数据标准不一致、数据采集不统一、数据管理制度不健全、数据共享困难等问题。他们建立统一的数据标准和管理规范,为后续提供高效、优质的数据服务。
信息中心明确各类数据归档时间节点,建立了新井数据采集流程,保障新数据及时准确入库。强化入库数据质量检查,确保数据治理效果。采用常态检查与专项检查相结合的方式,完成了数据治理单位的检查全覆盖,发布历史数据治理通报材料7次,新数据采集质量公报1次。
数据治理应用成效显著
1月25日,科研人员利用开发生产智能系统单井生命周期系统,轻点鼠标,便可清楚地观看到每一口井的日生产曲线、产液剖面图等信息。
通过近两年的努力,冀东油田目前已实现数据管理标准和流程规范化、单井全生命周期的管理、新井数据自动技术管控,中心主库数据入湖支撑了上游业务应用。
运行时,信息中心精准推进数据治理工作,逐步形成了三级管理、五级质量控制、两级技术支持的数据治理体系。
勘探开发研究院2018年度在研84个项目已全部纳入平台管理,其中8个重点测试项目已部分实现在线工作。地震处理解释辅助数据加载,以往手工分散加载,5口井需5小时,目前提速到5分钟,输入、输出效率大幅提升。
研究人员采集数据现场入库,样本点及表征交互甄选,开展测井解释研究。平台一键推送,图版研制过程可视、交互、便捷。以油气层图版识别为例,一个区块30口井数据准备、交会图绘制、标准图版研制从以往12小时缩短到30分钟。