首页 > 大数据 > 正文

浅析联机分析处理(OLAP)

2012-09-29 10:15:23  来源:互联网

摘要:联机分析处理(OLAP)最早由Arbor软件公司的E.F.Codd于1993年提出,他在《为分析型用户提供OLAP工具:信息技术的新需求》首次区分了面向事务处理的OLTP系统和面向分析处理的OLAP系统。
关键词: OLAP

    联机分析处理(OLAP)


    1 联机分析处理(OLAP)定义


    对于数据仓库中的数据,可以使用一些增强的查询和报表工具进行复杂的查询和即时的报表制作,可以利用OLAP技术从多种角度对业务数据进行多方面的汇总统计计算,还可以利用数据挖掘技术自动发现其中隐含的有用信息。


    联机分析处理(OLAP)最早由Arbor软件公司的E.F.Codd于1993年提出,他在《为分析型用户提供OLAP工具:信息技术的新需求》首次区分了面向事务处理的OLTP系统和面向分析处理的OLAP系统,并为OLAP确定了诸如多维概念视图、透明性、存取能力等12条规则。这些规则可概括为业务应用和技术应用这两类。其中多维概念视图,以多角度观察数据的方式方便了业务类用户带着解决问题的假设以及自己解决问题的逻辑推理的思维过程,也就是说,OLAP分析提供了用户在演绎型思考中前提、逻辑两个步骤中所需的帮助,因此它有助于提高用户分析结果的准确性。可见,OLAP分析工具是综合分析层次的工具之一。


    2 OLTP和OLAP的比较


    当今的数据处理大致可以分成两大类:联机事务处理OLTP(on-line transaction processing)、联机分析处理OLAP(On-Line Analytical Processing)。OLTP是传统的关系型数据库的主要应用,主要是基本的、日常的事务处理。OLAP是数据仓库系统的主要应用,支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果。图列出了OLTP与OLAP之间的比较。

    图2 OLTP与OLAP的比较

    图 OLTP与OLAP的比较


    OLAP是使分析人员、管理人员或执行人员能够从多角度对信息进行快速、一致、交互地存取,从而获得对数据的更深入了解的一类软件技术。OLAP的目标是满足决策支持或者满足在多维环境下特定的查询和报表需求,它的技术核心是“维”这个概念。


    “维”是人们观察客观世界的角度,是一种高层次的类型划分。“维”一般包含着层次关系,这种层次关系有时会相当复杂。通过把一个实体的多项重要的属性定义为多个维(dimension),使用户能对不同维上的数据进行比较。因此OLAP也可以说是多维数据分析工具的集合。


    OLAP分析中要理解变量、维、维层次、维的取值、维的分类等主要术语。变量指从现实系统中抽象出来用于描述数据的实际含义:维是与某一事件相关的因素在关系模型的抽象。如客户打电话,含客户、时间、地点、业务提供商、业务类型等这些与客户打电话相关联紧密的内容;维的层次性是人们观察数据细致程度不同造成的,即数据的综合程度不同导致不同的维层次,如时间维中以年、以月、以日为单位即形成了不同的维层次。它的目的满足业务类用户思考问题时逐层深入的需求:维的取值,也称为维的成员;维的分类是对维取值的划分。目的是为了在不同的类别间进行比较。如销售可分为畅销、不畅销、平销,移动业务类型可以分为通话、短信、游戏等。一个实际的系统中,维分类和维层次常常同时存在。事实是指不同维度在某一取值下的交叉点,它是对事件的度量。例如,××公司电视机4月份销售800台。其中800台是事实。一般来说数量和金额常作为事实。

[page]    3 联机分析处理(OLAP)的基本多维分析操作


    OLAP的一个重要特点是主要通过多维的交互式方式对数据进行分析,这与数据仓库的多维数据组织正好形成相互结合、相互补充的关系。这些基本多维分析操作包括切片(切块)、钻取、旋转等,便于用户从不同维度查询和分析有关数据。


    (1)切片和切块


    通过切片、切块功能,用户可以对数据进行过滤,专注于某一方面的问题,例如,用户通过拖拽的方式很容易的得到诸如“××地区2008年的销售情况”这样的数据。


    (2)钻取


    钻取包含向下钻取和向上钻取操作,钻取的深度与维所划分的层次相对应。向下钻取是通过对某一行汇总数据进行细分来分析数据。例如,用户分析“各地区、城市的销售情况”时,可以对某一个城市的销售额细分为各个年度的销售额,对某一年度的销售额,可以继续细分为各个季度的销售额。通过钻取的功能,使用户对数据能更深入了解,更容易发现问题,做出正确的决策。


    向上钻取是指自动生成汇总行的分析方法。通过向导的方式,用户可以定义分析因素的汇总行,例如对于各地区各年度的销售情况,可以生成地区与年度的合计行,也可以生成地区或者年度的合计行。


    (3)旋转


    旋转,也称数据转轴,就是改变维度的位置关系,如将行与列互换,或者将某一个行维移动到列维中。为了方便用户更直观的查看分析数据,应该支持数据的旋转功能,可从不同的视角来查看数据。对于一些数据,通过旋转功能,看起来可以更加直观,例如时间序列分析中,各地区各年度的增长量情况,把年份作为旋转维度,则同一地区不同年度的数据以及增长量将在一行显示,看起来更容易理解。


    OLAP分析中的多维分析充分体现为用户对某一个事实以多种角度展开分析。比如××公司电视机4月份销售800台,若以负责××地区的销售经理这一业务类角色来分析,他可以从时间维(如每日)、地区维(××地区的各个区县、各个区县的各个销售点)、品牌维(不同品牌、规格的电视机)、销售人员维(不同点上的销售员)等等维度以切片方式分别来分析,也可以综合起来作切块比较,也可以通钻取方式进行深入分析。


    目前,常见的OLAP主要有基于多维数据库的MOLAP及基于关系数据库的ROLAP。在数据仓库应用中,联机分析处理应用一般是数据仓库应用的前端工具,同时,联机分析处理工具还可以同数据挖掘工具、统计分析工具配合使用,增强决策分析功能。


第三十八届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训
责编:fanwei

免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。