2012-08-07 09:45:08 来源:万方数据
1、需求分析
企业数据中心建设是对企业核心数据资源的集中统一管理和集成化应用的实现,是实现企业数据资源共享和业务协同应用的关键一环。油田企业数据中心建设具有以下特殊性:
1.1专业门类众多,涉及的数据类型复杂
油田企业勘探开发业务有物化探、分析化验、井筒工程、综合研究、开发生产、地面工程六大业务域,三十多项业务,涉及的数据类型有结构化数据、文档数据、图形数据、体数据,其中体数据又有地震体数据、测录井曲线数据、地质模型数据、网格数据等多种,并且每种体数据又有多种格式,数据类型的复杂性使数据资源管理难度很大。
1.2数据量巨大
油田企业的生产数据要每天监测,有的需要几小时就监测一次,对于自动化采集的监测时间周期更短,而监测点又很多,造成了数据量增长迅速。比如采油井、注水井日生产数据,对于胜利油田这种大油田来说,有几万口生产井,每天都产生数据,几十年的开发期,数据量就能达到商业条。目前胜利油田平均每天的增量数据就有八九万条,年增长量就几千万条,随着信息化的不断深入,数据量增长速度会不断加快。
还有一种数据虽然记录数不多,但单体数据量很大,比如精细三维地震数据体等。巨大的数据量对数据中心的数据资源管理也是一个巨大的挑战。
1.3新技术的应用不断出现引起新的数据类型
石油天然气勘探开发是一个各种技术综合应用的专业,随时会出现新的技术和方法,就会产生新的数据类型,数据中心的建设必须要能够适应这种变化。
1.4数据管理情况不清
由于油田企业以前的数据库建设是按照专业进行的,同一业务对象不同时期的数据资料被分在了不同的数据库中,一方面数据资料的整体状况不清,另一方面,同一数据多头管理,数据质量状况不清。以上几个特点决定了油田企业数据中心建设必须要制定一套完整的数据资源组织和分类体系和元数据管理体系。
数据资源管理的目标就是要完成业务对象基于业务过程产生的成果资料的组织和编目,实现勘探开发数据资源面向业务对象基于业务过程的组织和管理;完成对于具体的业务对象在具体的业务过程中产生数据资源的数量、质量状况的整体情况的描述。
2、油田企业数据资源的分类与组织方法
2.1油田企业数据资源的分类
油田企业数据资源的分类可以借鉴图书馆对图书的分类。在图书馆中,根据图书的专业门类,从大类上分成了自然科学和社会科学,自然科学按照专业又可分为数学、物理、化学等,这样逐级细分下去,就能建立一套完整的分类体系,新出的图书可以根据此分类体系放到其应该归类的门类中,从而实现了有效的管理,方便了查阅。
油田企业的数据资源都是在不同的业务过程中产生的,如果我们找到一种相对科学的对业务的划分方法,再把数据资源归类到这些业务门类中也就找到了数据资源的分类方法。
在油田企业实际业务分析过程中,我们划分了物化探、分析化验、井筒工程、综合研究、开发生产、地面工程六大业务域,又在各业务域中逐级划分出了30多个一级业务,70多个二级业务,140多个三级业务,基本建立了比较科学合理的业务划分体系。[page] 在实际的数据中心建设中,数据资源的来源除了业务产生的数据外,还有一些公用信息也是非常重要的,这些信息不是从勘探开发业务本身产生的,而是来源于与其相关的其他专业和部门,这一部分数据资源与勘探开发业务中产生的数据资源的集合就是数据中心需要管理与应用的全部数据资源。
综上所述,油田企业数据资源的整体分类应该包含:公共信息、物化探、分析化验、井筒工程、综合研究、开发生产、地面工程七大部分,细的划分按照业务的层级分类。
2.2油田企业数据资源的组织方法
为了实现对数据资源进行有效地组织,胜利油田数据中心建设中对数据资源编目建立的方法如下:
(1)以业务对象及分类关系组成业务对象分类树,形成对业务对象的组织和管理;
(2)以业务过程(业务模型六大业务域及业务层级划分)组成业务树,业务活动是业务树的叶子节点,业务活动唯一的作用对象使业务活动与业务对象建立了关系;
(3)以业务单元为基础与业务活动建立关系,业务活动产生的数据资料以业务单元的方式组织,产生的数据资料分为结构化数据(数据表)、文档文档(包括附件)、图形成果(包括附件)以及体数据。
上述三个关系建立数据资源编目体系。表1是数据资料编目的例子,加上业务对象的分类树和业务活动树就形成了完整的油田企业数据资源编目。
表1 数据资料编目
通过数据资源的分类方法和组织方法,我们找到了对数据资源编目的规则,这些规则能够满足我们对已有和将有数据资料的组织和管理需求。
[page] 3、数据资源的元数据管理
对数据资源情况的管理需要有一套完善的元数据体系来实现。数据资源的元数据管理,规定了格式化数据、体数据、文档数据和图形数据四种类型的石油天然气勘探开发数据的元数据,主要包括对数据的产生场景、录入场景、数据质量、数据安全、参考系及数据特性的描述。石油天然气勘探开发数据管理元数据由四个元数据实体组成:
(1)标识实体:包括业务活动的标识和该活动产生的数据集的名称和标识等元数据元素:
(2)定义实体:包括业务活动产生的数据集的概要说明;
(3)管理实体:包括业务活动中数据的责任人(单位)以及数据质量、数据安全级别等元数据元素;
(4)表示实体:包括数据产生场景(操作者、时间、地点等)以及参考系等元数据元素。
按照石油天然气勘探开发数据的表现形式可分为结构化数据、体数据、文档数据和图形数据等四类,这四类数据的元数据实体集合构成以下四种元数据子集:
(1)结构化数据元数据子集:描述石油天然气勘探开发业务活动中可以表格化的数据的子集;
(2)体数据元数据子集:描述石油天然气勘探开发业务活动中具有特定格式的体数据的子集;
(3)文档数据元数据子集:描述石油天然气勘探开发业务活动中产生的文档数据的子集;
(4)图形数据元数据子集:描述石油天然气勘探开发业务活动中产生的图形数据的子集。
4、数据中心数据资源的综合查询实现
数据资源编目建立了业务对象、业务活动与数据资料的关系,为数据中心数据资源的综合查询奠定了模型基础。
在胜利油田数据中心建设实践中,我们实现了面向业务对象的查询、面向业务活动的查询、面向资料的查询和模糊搜索查询四种方式,为业务人员提供了丰富的查询手段。数据资源元数据的登记与管理为数据分布情况、质量情况等提供了分析资料,使我们能够清楚地了解数据资源的整体状况,方便了数据资源的业务应用。下图是对DXFS10井的数据资源状况的展示,通过对数据资源编目及元数据的集中展示,能够清楚地了解该井全生命周期的数据资源状况。
图1 DXFS10井数据资源状况展示界面
5、结语
通过对数据资源编目的编制和元数据管理系统的建立,为油田企业数据资源管理建立了统一的规则,也为数据中心的持续发展与建设奠定了管理架构基础。数据中心数据资源管理在胜利油田数据中心建设中的成功实施也验证了其可行性和实用性。
免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。