首页 > 大数据 > 正文

浅谈ERP与数据仓库的关系

2009-02-19 09:49:30  来源:万方数据

摘要:本文介绍了ERP和数据仓库的基本概念,阐述了ERP与数据仓库的关系,并给出了ERP数据仓库设计中的关键技术,这些技术包括:数据的装载、聚合、数据模型、联机分析处理、数据挖掘等。
关键词: ERP 数据仓库 B

    引 言

    ERP是Enterprise Resources Planning的简称,即为企业资源计划,是20世纪90年代发展起来的企业信息管理系统。ERP的内在含义是指利用计算机技术,将企业内部和外部资源信息按照成本管理原则分类整理所形成的信息管理系统。它的主要宗旨就是籽企业各方面的资源(包括人,财,物、产、供、销等方面)充分调配和平衡,使企业在激烈的市场竞争中能够合理地配置企业内部与外部的资源,全方位地发挥各方面的能量,从而使企业取得更好的经济效益。ERP在我国的应用起步比较晚,取得成功的企业更是少之又少。为了加强ERP在我国企业应用的成功率,必须结合我国的实际情况,并辅之以其它先进技术。把数据仓库和数据挖掘技术应用到ERP中,增强传统ERP的决策功能,就是一种新的尝试。

    1 数据仓库

    数据仓库是支持管理过程的、面向主题的、集成的、稳定的、不同时间的数据集合,以支持经营管理中的决策制定过程。它的四个基本特征是:①数据仓库中的数据是面向主题进行组织的;②数据仓库的数据是集成的;⑦数据仓库的数据是稳定的;④数据仓库的数据是随着时间不断变化的。

    数据仓库系统的基本体系结构如图一所示。作为一个系统,数据仓库至少应包括三个基本的功能部分:数据获取、数据存储管理和信息访问。

图一 数据仓库系统的基本体系结构

    图一 数据仓库系统的基本体系结构

    数据仓库的体系化环境是一种四层体系化环境,它是在一个企业或组织内,由各面向应用的OLTP数据库及各级面向主题的数据仓库所组成的完整的数据环境,在这个数据环境上建立和进行一个企业或部门的从联机事务处理到企业管理决策的所有应用。

    图二是对数据库体系环境的一个简单描述,它分四个层次:操作型环境、全局级数据仓库、部门级的局部仓库和个人级的数据仓库。

图二 数据仓库在体系化环境中的位置

    图二 数据仓库在体系化环境中的位置

    体系化环境的层次反映了数据与应用逻辑的抽象程度,可很好地与企业实际的部门组织结构对应起来,提高企业应用数据仓库的效率。企业采用这种四层体系化结构,即可在全局统一的数据仓库的基础上,各部门再发展自己的数据集成,是解决企业信息系统问题的有效途径。

    2 数据仓库与ERP的关系

    (1)数据仓库之外的EPP应用系统

    数据仓库的经典结构包括为转换处理提供数据的操作型应用程序、数据仓库、DSS处理,如数据集市、DSS应用程序以及数据挖掘和探索型数据仓库。对于ERP,数据仓库的基本结构并没有变化。

    ERP环境将数据提供给数据仓库的接口与非ERP环境的接口是很相象的,但也有以下不同之处:①ERP接口只需要处理ERP所支持的DBMS技术,而非ERP接口必须处理所有的接口技术;②由于ERP供应商拥有和控制着该接口,用户能更好地把握构成应用程序环境的数据和结构;③该接口经常需要进入到ERP环境,找到正确的数据并把它们”粘“到—起以使得这些数据在数据仓库中是有用的。

    (2)建造在ERP内部的数据仓库

    数据仓库可以建造在ERP环境之中,SAP的BW和PeopleSoft的EPM就是如此。在这种情况下,ERP产品供应商同时提供了应用程序和数据仓库。其主要的优点是ERP供应商提供了邀个体系结构,这就节省了大量的设计工作,并且降低了设计和开发的复杂程度。简而言之,将数据仓库包含在ERP应用中极大地简化了数据仓库的设计工作。此外,这种方式还降低了长期维护的难度。

    (3)通过ERP和非ERP系统为数据仓库提供数据

    因为将数据仓库纳入ERP应用之后,客户就有了完整的解决方案,因此这是一种常见的选择。然而,也存在别的选择,一个数据仓库可以建在ERP环境之外。同时非ERP系统也向该数据仓库提供数据。

    由于存在非ERP数据和ERP数据的集成问题,大多数企业并没有一个完整的ERP环境。非ERP应用系统总是存在的,在这种情况下,两种类型的数据必须要集成在一起。企业经常在构建ERP环境的同时为他们的非ERP数据建立数据仓库。当ERP环境完成时(或至少在功能上完成时)。非ERP数据的数据仓库也己经建立。在需要将ERP数据放入数据仓库的时候,将ERP数据从ERP环境中取出移入数据仓库是一件简单的事情。

    3 ERP数据仓库设计中的关键技术

    (1)数据的装载

    在数据装载到数据仓库中时首先要定义良好的数据清洗规则,保证数据的质量;其次对不同的功能要尽量做到模块化,以提高模块的重用性;再次,因为装载需要经常进行,数据可能会定期进行抽取,所有要优化装载程序,提高装载效率;最后不同的装载程序要在不同的时间运行,因此要确定一个合理的数据抽取计划。

    (2)聚合

    数据从ERP系统抽取到目标数据仓库后,为了进一步提高查询系统性能,最大限度地减少查询响应时间,以便更好地服务与决策支持,在设计数据仓库时,针对不同的用户,不同的查询要求。采用聚合设计导出了大量与聚合相对应的实体化视图,存储汇总数据,大大提高了易用性。但用户的需求往往是不断变化的,不可能预先定义所有的聚合,可以采用聚合导航器建立新的聚合。一旦新的聚合建立起来,将会通知聚合管理器,并在数据库管理系统范围内的汇总或全局表中注册,使可提供给用户查询使用。

    (3)数据模型

    数据仓库的实现是从逻辑模型到物理模型的转换过程,数据仓库的逻辑模型主要有:星形模型和雪花模型两种。一个简单的星形模式由一个事实表和多个维表组成。设计的方法简单,容易实现,但不能表示数据的多维层次结构;而雪花形模式却弥补了星形模式的不足,对维表进行了扩展,用添加子维表的方式来表示数据的维层次,使结构清晰。在ERP系统中,很多数据集合的维具有复杂的层次结构,如时间维由属性集合(年、季、月、星期、日)构成。ERP数据仓库的第一层可以考虑采用星型模型,第二层可以考虑选择雪花模型。这样能更好地满足不同层次的用户的需要,表达数据的维层次结构。

    (4)联机分析处理的数据清理和数据挖掘

    由于访问ERP数据仓库的用户分布于不同的部门和组织,主要通过Internet/Intranet访问信息,因此OLAP采用三层结构模式。OLAP服务器用来对数据仓库中的数据进行多维化或预综合处理,形成多维视图,使用户能从多角度、多侧面、多层次地分析数据,为具有明确查询分析需求的用户提供高性能的决策支持。

    针对OLAP和ROLAP的特点,设计ERP数据仓库时,数据仓库的第一层数据采用ROLAP技术管理,数据仓库的第二层数据采用MOLAP技术管理,这样既可以满足用户对系统性能的要求,同时也能满足企业存储大量细节数据的要求。

    (5)数据挖掘

    数据挖掘一般都是在数据仓库的基础上进行的,从数据仓库中直接得到进行数据挖掘的数据有许多好处。数据仓库的数据清理和数据挖掘的数据清理差不多,如果数据在导入数据仓库时已经清理过,在做数据挖掘的时候就没有必要再清理了,而且所有的数据不一致的问题都已经被解决。这样可以提高效率,节省挖掘数据所需要的时间。由于数据仓库的数据量大,直接在数据仓库上进行挖掘,会影响挖掘的效率,因此数据的挖掘一般不在数据仓库上直接进行,而是要单独的建立数据挖掘库。


第三十八届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训
责编:

免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。