2017年1月6日,东北石油大学校长助理、教授李春生在CIO时代APP微讲座栏目作了题为《油田大数据应用探索》的主题分享,他从大数据的基本概念、油田大数据应用过程、油田数据现状分析、油田大数据应用方向、大数据应用案例分析五个方面谈油田大数据应用探索。
一、大数据的基本概念
(一)大数据的定义
大数据是指无法在一点时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
针对油田而言,它的数据相对其他行业是较为完整的。油田从勘探开始,一直到采油的整个生产过程中,其所有的数据都有记录,但不同阶段记录的数据形式是不同的。例如在早期是报表记录,后来通过数据采集形成大力度的数据,目前通过互联网的应用已形成详细的数据记录。国际上为有效管理目前的油田数据,五大石油公司及一些院校成立了相关组织,用于制定油田数据的模型和标准。目前国内试图引入该组织,但历经十多年后还是停滞了。
中国的油田目前的数据管理基本为两个阶段:第一个阶段是上世纪八十年代,制定了勘探开发数据库,将国内各个行业的教师、专家聚集在一起制定中国石油标准。勘探开发数据库是面向主题的一些数据,根据业务的基本情况组织数据。第二个阶段是目前的石油行业开始了一种新的数据组织方法,对数据进行分层次多极化管理。
(二)大数据的系统研究维度
提到大数据应用从以下三个方面进行:理论方面、技术方面、时间方面。
理论方面。主要是认知必要的途径,即被广泛认同传播的基准路线,如特征定义、价值探讨、目前和未来的发展趋势、大数据隐私等等。
技术方面。主要是云计算、分布式处理平台、存储技术、感知技术等等。
实践方面。包括互联网的大数据、政府的大数据、企业的大数据及个人的大数据。
二、油田大数据的应用过程
主要分为大数据形成、浅表特征呈现、数据挖掘分析及其多元化应用研究四个方面。
大数据的形成由以下几个方面逐步形成:办公数据备案、生产数据积累、数据集成与整合、业务数据处理等等来形成原始数据。
浅表特征主要是做在原始区域的基础上如何进行简单的应用和展示,如专项数据成图、模拟仿真建模、列表式展示等等。
数据挖掘分析主要是在原来数据积累的基础上进行潜在特征的挖掘、异常追踪预警、知识发现、趋势分析等。
多元化应用研究主要是结合GIS应用、数模分析、立体仿真成像、一体化研究等使数据发挥更大的潜在价值。
三、油田数据现状分析
(一)基本概况
涉及领域广。如生产数据、地质地貌数据、措施数据、作业数据、辅助支撑数据等,基本涵盖了油田勘探、开发、生产、装备等所有相关领域。
数据存储形式。包括了结构化(关系型数据库)、半结构化(电子表格)及非结构化数据。
逻辑组成。目前国内的油田采取A1,A2,A3…,按不同行业分出不同的类别,组成所有的数据。勘探开发数据逻辑、井下作业数据库逻辑等,过程逻辑结构及面向对象逻辑结构交叉。不但能够提高模式表达的准确率,同时使方法具备。
(二)数据特点
数据完整性较好、数据基数大、数据间业务关系极强、数据准确率较高、数据更新速度快、数据呈现多样性。
四、油田大数据的应用方向
主要有以下四个方面:油田大数据集成与处理;追踪式业务及日常工作管理;油田开发生产领域的知识发现及推理应用;与地理信息系统(GIS)、3D建模技术等结合,以便于指导决策。
(一)油田大数据集成与处理
油田大数据集成与处理的目标主要立足于油田应用业务的本身、油田业务数据结构涉及业务数据模型采用实用的技术集成和处理过程。由于历史原因,油田所有的信息系统一开始不是集成在一起来做,而是分散孤立的系统,数据类型、表示方式均不相同,如何使所有的油田数据统一化,是集成所做的工作,将分散在各地的数据如何集中起来也是其工作之一。包含的过程有三点:第一,基于油田业务的数据结构、构建、应用领域的业务数据模型;第二,设计数据集成、数据处理过程;第三,完成数据模型的管理及对数据过程的控制。数据集成的意义是强化后期深入数据计算和分析能力,摒弃不相关的数据,提高数据处理速度。这项技术的难点主要是数据处理过程的设计,相对困难一些,针对不同的数据分别一一处理,没有统一的方法。具体实例如下图:
首先进行模型设计,模型中有设计两个实体,一个是动态数据实体(反映油田的生产单元),一个是静态数据实体(描述油田生产单元生产的基本属性)。在两个实体描述过程中需要三个数据,分别为开发历程数据、动态管理数据、产量预测及其预警。模型设计成功后面对的问题是如何采用数据集成集成相关数据,采用软件Agent技术,在集成的地方开发一个控制中心,生产各个Agent,根据需要将其分布在各个地方。其中主要包括控制中心(派出Agent、生产Agent)、行为业务响应(响应式Agent)、孤独业务处理模型(定时式Agent)。
(二)追踪式业务及日常工作管理
主要采用层级划分的思想结合实际业务、工作及其模式管理进行场景式追踪,为决策者提供自上而下的管理支持。包含的过程有三点:第一,底层数据模型的建立,数据的抽取与处理;第二,涉及领域的日常工作及业务管理功能的设计;第三,管理结构与功能对接及其一体化追踪模式设计。这项功能的意义是强化决策者管理能力,提高日常工作效率和管理水平。这项工作的难点是数据模型的建立标准业务管理及其日常工作的涵盖度。
(三)油田开发生产领域的知识发现及推理应用
知识发现的目标是以知识工程为主导,采用数据挖掘、模式挖掘等技术,实现对油田开发、生产、勘探等领域的专家知识发现及推理应用。包含的过程有数据获取、只是挖掘及知识推理。这项功能的意义是深层发现潜在知识,强化预警及动态分析能力。这项工作的难点是理论方法及应用推广。
(四)与地理信息系统(GIS)、3D建模技术相结合
与地理信息系统(GIS)、3D建模技术等结合,挖掘出的使知识更有清晰的呈现过程,目前这方面的应用可以使知识更加通俗易懂。
五、大数据应用案例
(一)聚驱生产动态预警系统
如今通过收集聚驱所有数据,找到各种报表,针对已知的情况挖掘聚驱所有的数据呈现的模式分布,进而形成知识。当然,数据在实施生产的过程中应与挖掘模式进行适应性匹配,如果与趋势吻合,便可以产生预警,通报有关人员。这一系统以数据挖掘为基础,实现聚驱生产模式发现,用以对单井未来生产状况分析。
(二)天然气安全隐患跟踪系统
这个项目以天然气安全隐患管理日常业务功能为基础,开发辅助决策、隐患综合跟踪系统,依据自顶向下的管理模式面向决策者开开放隐患问题的综合跟踪,将下面工作站对应的隐患问题进行汇总,以业务单位的模式实现隐患追踪。隐患的来源有两种途径:一种是通过人工上报;一种是通过生产过程的挖掘,进行实时数据挖掘。决策者可根据跟踪系统追踪到隐患问题的源头。其应用方式是根节点统计下节单位的所有风险隐患,以单位为基准进行二级单位追踪,并一直追踪到基层单位的风险隐患情况,在基层单位实现风险隐患汇总,并可查看各类风险隐患的分析报告与结果。这个项目是通过数据的综合应用达到科学化管理。
第三十四届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训
责编:李春生
免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。