首页 > 大数据 > 正文

数据仓库在企业能效评估系统中的应用

2010-07-13 16:57:21  来源:万方数据

摘要:以数据仓库及OLAP为工具,设计企业能效评估系统,并且针对某化工企业,以设备能效分析主题为例,详细阐述了企业能效数据仓库概念模型、逻辑模型和物理模型的设计,并以MS SQL Server 2005
关键词: 数据仓库 能效评估

    1 引 言

    随着我国经济的快速发展,能源消费量逐年增加。但能源利用效率却远远低于发达国家,这严重限制了可持续发展战略的实施。为了解决这个问题,在国家“十一五”规划中,我国政府提出了创建资源节约型经济社会的建设目标。要实现节能降耗的目标,工业产业中的高能耗企业是工作的重点对象。许多高能耗氽业目前没有一套科学、合理的能效评估体系。对能源的具体使用情况及其产生的效益缺乏准确的认识,造成了能源在生产过程中的流失和浪费现象,影响了产品成本的估算和企业能耗的有效控制。

    目前数据仓库的应用越来越广泛,主要是应用于金融、电信等行业,但在高能耗企业,这方面的技术还未得到充分的应用。对于高能耗企业,全面的生产用能数据对高能耗企业的能效评估和节能分析有重要作用,然而这些数据是彼此分散、各自独立的,甚至是不相一致的,通过建立数据仓库,可以将这些数据进行集成和统一,再利用数据分析工具分析和挖掘这些数据的信息,发挥这些数据的价值,使它们成为企业能效评估的重要依据。

    该文的研究足以MS SQL Server 2005平台为基础,创建数据仓库。该系统的设计与实现为典型能耗企业高效使用能源提供定量的分析与优化手段,实现企业能效评估的数字化和系统化。

    2 数据仓库和联机分析处理概述

    根据数据仓库奠基人W.H.Inmon认为“数据仓库(Data Warehouse)是数据仓库是一个面向手题的、集成的、永久的且随时间不断变化的数据集合,它用于支持管理中的决策制定过程。”数据仓库将大量用于事务处理的传统数据库数据进行抽取、清洗、转换,并按决策主题的需要进行重新组织,这种高度集中的数据为各种不同的决策需求提供了有用的分析基础。典型的数据仓库系统的体系结构如图1所示,由数据仓库、数据仓库管理系统和数据仓库应用分析工具3个部分组成。

图1 数据仓库体系结构   

图1 数据仓库体系结构

    联机分析处理(OLAP)是与数据仓库密切相关的一种决策分析工具。OLAP技术使数据仓库能够快速响应重复而复杂的分析查询,从而使数据仓库能有效地用于联机分析。OLAP的一个主要特点是多维数据分析,主要通过对多维数据进行切片和切块、钻取、旋转等来实现。OLAP的多维数据分析与数据仓库的多维数据组织正好形成相互结合、相互补充的关系。因此,利用OLAP技术与数据仓库的结合可以较好地解决传统决策支持系统需要处理大量数据的问题。

    在企业能效评估系统数据仓库与联机分析系统体系结构设计中,采用了3层客户机,服务器结构。这种结构将数据仓库、OLAP服务器与客户端严格区分开。在该数据仓库巾既包含了大量业务处理系统的操作细节数据和其综合数据,也包含了历史数据和近期数据,这些数据是OLAP应用的基础。OLAP服务器的主要用途是对数据的分析与决策进行管理,同事OLAP服务器还要根据客户的需求对多维数据集进行分析,并将分析的结果以可视化的方式传递给客户端。

    3 企业能效数据仓库设计

    设计食业能效数据仓库的第一步是确定主题。主题是与企业相关的重要的物理项、概念、人、地点和事件的主要分组,数据仓库是按照=E题域模型进行组织的。设计数据仓库首先要从企业的生产用能数据入手,综合决策支持的实际需要,确定数据仓库的主题、根据系统所要实现的功能,该食业能效数据仓库包含了设备能效分析,经济能妓分析、环境能效分析3个主题。为了满足企业管理者的需求,本文建立的是以设备能效分析为主题的企业能效数据仓库实例。其次需要确定的是支持设备能效分析这个主题的数据源。上海氯碱化工股份有限公司是国有特大型企业,有大量的历史与近期数据,数据源比较丰富。设备能效分析皇题是从各个设备包括主能耗设备、加工转换单元、输送分配单元对食业能效进行分析。在企业能效数据仓库模型中,分3步来进行设计,分别是概念模型、逻辑模型和物理模型设计。本文针对上海氯碱化工股份有限公司,以设备能效分析主题为例,给出企业能效数据仓库的完整的设计方案。

    3.1 概念模型设计

    数据仓库设计中概念模型设计的目的是确定面向主题的信息包图,完成界定系统边界和确定主要的主题域及其内容,其成果是在原有的数据库的基础上建立一个较稳定的概念模型,是在较高抽象层次上的设计。

    3.2 逻辑模型设计

    目前最流行的数据仓库模型是多维数据模型,多维数据集的结构巾其度量值及维度定义。度量值及维度均出自多维数据集数据源中的表。这些表的集合称为该多维数据集的数据模型。每个多维数据集数据模型均包括一个事实数据表以及一个或多个维度表。数据仓库的逻辑模型即多维数据集数据模型一般有两种常见的类型:星型模型和雪花模型。

    星型模型足基于关系型数据库的、面向OLAP的一种多维数据模型的数据组织形式,通过使用一个包括主题的事实表和多个包含事实的非正规化描述的维度表来执行决策支持查询,从而获得比高度规范化设计结构更高的查询性能。

    雪花模型虽然较星型模型更符合规范化的设计结构,但它增加了查询的复杂度,降低了查询的性能。因此本数据仓库采用星型模型。该企业能效数据仓库中设备能效分析主题的逻辑模型如图2所示。

图2 设备能效分析主题逻辑模型   

图2 设备能效分析主题逻辑模型

    3.3 物理模型设计

    概念模型是指数据在数据仓库中的存放形式和组织形式。设计物理模型还包括确定索引策略、数据存放位置和存储分配。具体来说,就是要在星型模型或雪花模型的基础上,确定事实表和维表的结构;明确两者的数据字段、数据类型、关联字段、索引结构;确定数据仓库中多维数据集的存储结构,如物理存取方式、数据存储结构,数据存放位置及存储分配是否分区等。

    目前大多数数据仓库都是建立在关系型数据库的基础上,最终数据的存储是南数据库系统进行管理的。在该数据仓库的设计中,选用MS SQL Server 2005及其组件分析服务器作为数据库和数据仓库的管理系统。数据仓库在逻辑卜是多维的,但在物理存储上其多维数据集的存储方式可以有关系型联机分析处理(relational online analytical processing,ROLAP),多维联机分析处理(multidimensional online analytical processing,MOLPA)和混合联机分析处理(hybrid online analytical processing,HOLAP)3种方式。

    在该数据仓库中,多维数据集的存储选择HOLAP方式,即基本数据保留在原有的关系数据库中,而聚合体则存储在分析服务器上的多维结构中,这样不仪可以避免数据重复,还能够提高查询性能。

    4 实 现

    针对该化工企业,此数据仓库的实施是以MS SQL Server2005平台为基础,前端编程工具为C#.NET。

    创建企业能效数据仓库,首先从企业各个相天部门获取数据表,并按照数据仓库的设计要求迸行改造,建立起一个源数据库。这步非常关键,它是整个数据仓库建立的根本,也直接地决定着系统的分析功能。其工作最足非常大的,并且需要对各种数据进行非常细致的选择、整理、清洗等工作,以保证数据的质量。数据的质量包括数据的正确性、明确性、一致性和完整性。

    建立源数据库之后,通过SQL Server中的DTS(Data Transformation Service)服务工具,创建数据仓库中的事实表与维表;通过Analysis Services来建立多维数据集,实现OLAP操作,支持多维查询表达式(multi dimensional expression,MDX)查询,并通过自动构造MDX语句,实现上卷、下钻、切片、切块、旋转等OLAP运算。

    在前端数据展现上,可以用C#.NET通过Analysis Services所提供的数据透视表服务进行开发,或直接利用MS Office中的Excel和Access,来实现对多维数据集的数据展现功能。从而可以方便地得到各种统计报表和分析图形。

    5 结束语

    只有充分利用、分析高能耗企业在日常生产过程中所产生的大量的历史数据,才能从中获得有用的数据信息。将数据仓库应用到企业能效评估系统中,能使评估数据的数量丰富、质量提高,从而为评估结果准确度的提高做出贡献,也为企业生产用能管理提供有效依据,使企业决策人员能更有效地确立节能技改方案,更有效地指导节能降耗工作;同时数据仓库的构建为下一步进行数据挖掘奠定基础,为其他类型企业能效数据仓库的构建也有一定的参考意义。


第三十八届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训
责编:

免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。