2012-08-01 10:11:29 来源:万方数据
当前,国内很多企业都已经实现了不同程度的管理信息化,但随着业务的增加,企业的发展,数据量增多,数据复杂性增大,传统的基于数据库的管理信息系统越来越无法满足企业管理决策的需要。基于现有的企业管理信息系统中的常规关系数据库,建立数据仓库,支持解决企业管理策略的相关问题,如分析不同地区的销售趋势,不同类型客户对产品的偏好,制定宣传策略,制定财政预算,制定发展规划等等,这是一种决策支持系统的新型技术。
1 数据仓库技术
数据仓库(Data Warehousing)是指面向主题的、集成的、非易失的、随时间变化的数据集合,用来支持管理人员的决策。数据仓库中的数据面向主题,与传统数据库面向应用相对应。主题是一个在较高层次上将数据归类的标准,每一个主题对应一个宏观的分析领域所涉及的分析对象。面向主题的数据组织方式,就是在较高层次上对分析对象的数据的一个完整、一致的描述,能完整、统一地刻画各个分析对象所涉及的企业的各项数据,以及数据之间的联系。集成性是指源数据在进入数据仓库之前要进行一致性转化和数据综合计算。非易失性是指对数据仓库中的数据通常是批量载入和访问的,不涉及一般意义上的数据更新。随时间变化是指数据仓库中的数据是一系列对源数据的不同时刻的复杂快照。
2 数据仓库源数据组织方法
建立企业数据仓库是一项工程量和投资都比较大的系统工程,并且有一个比较重要的基础条件是整个企业的主要业务信息子系统已经成形,否则无法对源数据进行有效的组织管理,得到理想的决策依据。由于企业决策者关心的是具体的实际问题,所以企业化大力气建设的数据仓库要很好的服务于决策者的问题要求。针对这种情况,我们尝试用一种以决策者关心的问题为出发点和核心的数据组织方法来构建企业数据仓库。
2.1 主题分析
数据仓库数据组织的首要问题是根据决策者的主要问题建立主题模型。主题模型表示与此主题业务相关的所有重要信息综合。经过需求调查分析,决策者主要关心三个方面的分析问题:1)市场营销主题。不同时期(年、季度、月)销售情况变化趋势分析;不同地区分公司(国家、省份、城市、分公司)销售情况比较分析等。2)人力资源主题。不同时期(年、季度、月)职员薪资变化趋势分析;不同地区分公司(国家、省份、城市、分公司)职员薪资比较分析等。3)开支预算主题。不同时期(年、季度、月)各项财务指标(总资产、负债、销售收入、各项支出)变化趋势分析等。[page] 2.2 构建业务主题相关逻辑模型
数据仓库的设计与传统数据库的设计不同,并非完全由需求驱动的,因为在用户使用之前,大多数需求是未知的,而且原数据库的数据也决定了数据仓库所能满足的需求,因此,数据仓库的设计是数据驱动和需求驱动相结合的。即按照预测的需求筛选与集成数据,根据数据设定可能满足的需求。决定采用图1所示的设计步骤。对应每个业务主题,我们都建立了一个业务主题表,用来保存每次业务中能获得的相关信息,成为数据仓库的事实表。事实表的建立是依存于企业现有的业务信息系统数据范围。
其实体关系图如图2所示。
图1 系统设计流程图
图2 数据仓库实体关系图
2.3 数据仓库数据初始化和维护
在完成前面的步骤之后,数据仓库的源数据组织结构基本成型,需要向组织中灌入初始数据以维护组织中的数据。灌入初始数据是一次性的工作,可以通过数据导入程序来完成。在导入数据过程中要维护数据的完整性和可修复性。我们提出了两种方法:数据库复制和数据库触发器。数据库复制主要针对那些不需要进行格式转换和检查的数据;数据库触发器主要针对业务主题表而言;由于业务主题表中的数据通常来源于几个数据表,而且,需要检查数据和转换数据格式,因此业务主题表的数据一般不能通过数据库复制来维护。
3 结束语
本文提出的源数据组织技术充分考虑了决策者分析问题的要求,片且结合数据仓库的基本特点,采用了面向主体集成的数据管理,使开发人员更容易理解和利用组织内的数据;相对投入的工作量和成本小,又能满足业务数据的分析要求要求。本文从一个实例出发对数据仓库的源数据组织的实用化进行了一些探索,该方法能够在建立整个企业数据仓库的过程中有较好的应用,从而为生成有效的决策分析依据提供高质量的数据源,对企业的经营管理产生真正的推动作用。
免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。