2012-11-01 13:47:51 来源:互联网
随着国内水泥企业信息化建设和应用的逐步深入,各类业务系统已在企业中广泛使用,企业内部建立了ERP系统(企业资源规划)、CRM系统(客户关系管理)、人力资源管理系统等基础信息化系统。这些系统的特点是通过业务人员在客户端对数据库进行操作。因而在系统的实际使用中,各个部门用户往往局限于对已有的海量数据做一些简单的、局部的和浅层次的查询,缺乏对相关数据信息进行深层次的分析和利用,“数据泛滥,知识贫乏”的现象很普遍,企业领导决策时,往往更多的是依靠决策者的的直觉、假设。以及各类报表的简单。这表明企业的正确决策对数据信息有着全面和深人的客观需求,将企业在日常事务中积累、沉淀的大量历史数据集成为可靠的决策支持信息,已成为水泥企业关注的重要问题。
基于Pentaho的商业智能能够充分利用水泥企业内部的各类信息系统,从业务系统的基础数据库中抽取需要的数据。通过对这些数据进行清洗、转换、加载和集成,实现商业信息的搜集、管理和分析。为企业决策者提供全面、准确、系统和直观的决策支持。
1 商业智能和Pentaho平台
1989年,Gartner的分析师Howard Dresdner首次提出了“商业智能”(Business Intelligence,BI)的概念:它是将数据转换成信息的过程,然后通过发现将信息转化为知识,并将知识应用到商业行为上的一个过程。
图1中,商业智能实质上是将数据转化为信息的过程。这一过程也可称为信息供应链,其目的是把初始的操作型数据变成决策所使用的商务信息。在这一过程中,数据集成过程执行源数据的清洗、格式转化和合并计算等功能:数据存储过程建立数据存储模型,存储企业统一的数据视图,为商业智能系统的应用提供基础数据:数据分析工具一般包括OLAP(联机分析处理)、数据挖掘工具、统计分析工具及其它人工智能工具等,这些工具结合商业处理规则为决策者提供决策辅助信息。
商业智能软件区别于一般的管理应用软件,在决策支持中发挥重要作用,有着广阔的市场前景,近年来在国内外受到高度重视。目前,微软、Oracle、IBM、SAS等实力雄厚的公司都已把本身产品扩展到BI领域,其凭借雄厚的技术力量。能为大型企业提供完整的BI平台和解决方案。然而,这些厂商提供的都是需要商业软件授权的解决方案,国内企业在实施商业智能过程中往往需要花费高昂成本。而采用开源软件产品,比如开源数据库、服务器软件等,则既有利于功能定制开发,也在授权和成本方面比商业软件有着绝对优势。在如今的开源BI社区,很多优秀的开源产品完全可以和商业产品一较高低。Pentaho便是目前应用比较广泛的开源项目。
图1 数据转化为信息流程图
图2 水泥企业商业智能信息系统的体系结构
Pentaho BI平台是一个以过程为核心,面向解决方案的、可扩展的商务智能平台。其目的在于将一系列企业级BI产品、开源软件、API等等组件集成起来,方便商务智能应用的开发。Pentaho的功能十分强大,它对BI的功能提供了全面支持。包括数据仓库、ETL、OLAP、数据挖掘等技术,同时提供流程设计、报表生成、测试和部署的集成开发环境。
[page] 2 水泥企业商业智能信息系统
目前,国内大多数水泥企业都已上线ERP系统。ERP系统是指建立在信息技术基础上,以系统化的管理思想,为企业决策层及员工提供决策运行手段的管理平台。它将企业的物流、资金流、信息流这三大资源进行一体化集成,其管理内容涉及到企业的生产控制、物流管理和财务管理等各个方面。
通过在水泥企业原有的ERP系统基础上构建Pentaho商业智能平台来实现系统集成,使水泥企业不仅在一个集成的环境下,有一个合理、严格的流程控制,有效地完成日常的业务作业,产生大量准确的数据,同时将这些操作型数据变为分析型数据,从分析型数据中提炼决策信息。协助水泥企业决策者做出正确的决策,促进水泥企业对信息的深度利用。ERP可以为BI提供大量的准确的源数据,BI中的OLAP技术和数据挖掘技术(DM)能从数据仓库中获取数据并进行多目标多维度的分析,对用户随机性的查询并形成报告不用消耗大量的计算机资源,消除了不必要的资源开销。
在水泥企业ERP系统上构建Pentaho商业智能信息平台的体系结构主要由ERP业务子系统、业务数据库、数据转换工具、数据仓库、数据集市、Mondrian OLAP分析工具、Weka数据挖掘工具和决策支持子系统组成见图2。
该集成系统将各子系统中的海量数据经过抽取、清洗、转换、加载等过程,转换为分析型数据,加载入数据仓库。数据仓库中的数据根据不同部门的实际要求,再经抽取、综合、加载而进入不同的数据集市。成为部门经营、管理和决策的数据库。利用OLAP和数据挖掘技术对数据仓库或数据集市中的数据进行分析和处理。分析和处理的结果,可以直接提供给用户,也可以作为知识进入决策支持系统的知识库,知识库中的知识通过推理机中的推理规则,产生推理结果,提供给管理决策者。所有的数据传输、前端数据展示等均采用基于Pentaho的商业智能解决方案。
3 基于Pentaho的商业智能对水泥销售的多维分析
水泥销售多维分析通常从时间、地区和产品的不同角度来深入观察产品的销售情况。这里的时间、地区和产品就是维。而这些维的不同组合和所考察的度量指标构成的多维数组则是OLAP分析的基础,可形式化表示为(维1,维2,…,维n,度量指标),如(地区、时间、产品、销售额)。多维分析是指对以多维形式组织起来的数据采取切片(Slice)、切块(Dice)、钻取(Drill-down和Roll-up)、旋转(Pivot)等各种分析动作,以求剖析数据,使用户能从多个角度、多侧面地观察数据库中的数据,从而深入理解包含在数据中的信息。
[page] 水泥销售多维分析的核心是位于服务器端的Pentaho平台,Pentaho平台主要由以下几个部分组成:(1)OLAP服务器。Mondrian是纯Java开发的OLAP服务器,通过该服务器。用户可以对存储在关系数据库中的大型数据集进行交互分析。(2)OLAP展示工具。JPivot可视化组件,包括多维数据表和多维数据图,可以完成数据立方体的展示。由于该组件基于JSP网页方案,适应B/S模式开发。通过报表生成工具Report Designer,可以进一步生成专业的分析报表。(3)ETL工具。Kettle是和Pentaho整合的开源ETL工具,包括Spoon和Pan两个包,用于定义和执行转换操作,可以使用Chef或Kitchen让定义的ETL任务定时自动执行。Kettle的Spoon和Chef工具有友好的图形化界面,很容易使用。(4)数据挖掘工具。Weka是功能强大的数据挖掘软件,提供了丰富的挖掘算法和可视化支持,适合配置紧耦合的挖掘环境。(5)集成管理和开发环境。Pentaho Design Studio,基于Eclipse的开发环境,内置的Action Sequence编辑器提供了定义工作流的图形化界面。此外。开发人员可以很方便地利用该环境进行项目测试和部署。
表1 水泥产品销售多维分析
图3 水泥产品销售多维分析柱状图
现已湖南某水泥企业2008年的销售数据为基础数据。构建基于Pentaho的商业智能解决方案。把销售数据导入Oracle10g数据库,作为支持Pentaho解决方案的基础数据库,创建处理销售数据的Action Sequence应用,把应用部署到在Mondrian OLAP服务器上。Mondrian OLAP核心引擎根据部署的配置文件,从关系数据库中计算和缓存数据,并响应来自表示层的各种查询。查询可以是MDX语句,而MDX预先存储后,非专业用户可以在图形化交互界面中进行数据分析。启动Pentaho服务器,通过Web运行得到水泥产品2008年的销售数据多维分析和柱状图见表1、图3。通过对水泥的时间、地区和产品的多维分析,可以得出水泥销售中的地域性差别比较大的一般性结论:随着企业历史数据的累积。这种多维分析还将发现更多隐含的信息,可以帮助企业决策获得更好的支持。
4 结论
通过ERP系统与商业智能的集成,构建水泥企业商业智能信息平台,可有效利用ERP系统的海量历史数据,通过将操作型数据转换为分析型数据,从中提炼出决策信息,可实现水泥企业对信息的深度利用,提升决策水平。基于Pentaho的商业智能解决方案,可以有针对性地实现水泥销售的多维分析,其结果直观、高效。Pentaho平台部署简单、操作简易、运行成本低,因此易于应用并取得成效。
免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。