2011-05-23 09:11:00 来源:万方数据
一、引 言
企业信息化指的是信息技术在企业各个运作流程中的有机应用,这些流程包括物流、资金流、信息流、技术流、客户流等。我国企业信息化已经历了3个发展阶段:第一阶段是办公自动化(OA),涌现和积累了大量的电子文档;第二阶段是建立了管理信息系统(MIS),标志着数据库和网络的应用;第三阶段是企业资源计划(ERP)的实施,它意味着企业业务流程的重组和自动化。随着科学决策在企业的广泛应用以及企业适应能力和灵敏度的提高,数据挖掘和企业智能将是今后企业信息化建设的重点。数据挖掘是一个新兴的技术领域。它汇聚了数据库、人工智能、统计学、可视化、并行计算等不同学科。近年来受到各界的广泛关注。现代的企业日常搜集了大量资料.包括市场、客户、供货商、竞争对手以及未来趋势等重要信息。但是信息的超载与无结构化,使得企业决策单位无法有效利用现存的信息,甚至使决策行为产生混乱与误用。妥善地运用数据挖掘技术,从巨量的数据库中发掘出不同的信息与知识供决策支持所用,必能产生企业的竞争优势。但是,许多企业在信息化进程中对数据挖掘还存在一定的认识误区,对其角色定位还不甚清晰,这直接影响了数据挖掘技术的应用效果。
二、数据挖掘在企业信息化中的应用现状
数据挖掘在企业中的应用方式目前主要集中在市场推广方面。如客户特征、购物关联分析及客户关系管理。世界范围内具有刨新性的公司都开始采用数据挖掘技术来判断哪些是他们最有价值的客户.并重新制定产品推广策略,即把产品推广给最需要的人,以用最小的花费得到最好的销售。在客户特征方面.数据挖掘可以从现有客户数据中找出他们的特征.再利用这些特征到潜在客户数据库里去筛选出可能成为客户的名单,行销人员就可以只针对这些名单寄发广告数据,以降低成本,提高行销的成功率;购物关联分析主要是用来帮助零售业者了解客户的消费行为,利用数据挖掘,零售业者可以更有效地决定进货量或库存量,或是如何摆设货品,同时也可以用来评估促销活动的成效;在客户关系管理中,利用数据挖掘可以由原客户后来却转成竞争对手的客户群中。分析其特征,再根据分析结果到现有客户资料中找出可能转向的客户,然后设计一些方法预防客户流失。此外,数据挖掘还可以对销售数据进行深层次的分析,采掘隐含在数据中的有用信息,发现和把握新的市场机会,为企业的管理决策提供科学的依据。
可见,数据挖掘主要用于企业的决策支持、客户关系管理、市场分析、营销策略和趋势预测等方面,它可以提供比较可靠的依据,使企业的决策走向科学化,而不再单纯依赖经验,应用的行业包括金融业、电信业、零售商、直效行销、制造业、医疗保健及制药业等。在我国,许多企业如电信公司、银行等开始向数据挖掘的方向走,但由于刚起步,许多企业对数据挖掘的认识还存在误区,对它的角色定位还不够准确。
三、企业信息化进程中对数据挖掘的认识误区
1.数据挖掘可以解决企业中所有的商业信息问题
事实上,数据挖掘并非能解决企业中所有的商业信息问题,数据挖掘仅是一个工具,在挖掘信息之前仍然需要了解企业的业务,理解企业的数据,弄清分析方法。数据挖掘只是帮助企业更深入、更容易地分析数据,它无法告诉你某个模型对企业的实际价值。因此,提及数据挖掘,企业应首先考虑用数据挖掘解决什么样的商业问题,是进行客户群体划分、背景分析、交叉销售,还是客户流失性分析、客户信用记分、欺诈发现等。不同的商业问题,需要用不同的方法去解决,要想真正作好数据挖掘,数据挖掘工具只是其中的一个方面,没有哪一种数据挖掘的工具可以应付所有的要求,所以,进行数据挖掘首先要考虑的是,准确地定义所要解决的商业问题。
2.不需要对数据进行准备和了解,就能得到好的数据挖掘结果
与传统的统计分析相比。数据挖掘的确不用专门进行实验设计和调查设计。不用为确定的目的准备大量的数据,因为在进行数据挖掘之前已有数据库,其目的也是不确定的。作为一种先进的数据信息处理技术,数据挖掘与传统的数据分析的本质区别在于它是数据关系的一个探索过程.而且多数情况下是在没有任何假设和前提的条件下完成的。就现实来看。经过几年的信息化建设,许多大中型企业已经建立了比较完善的客户关系管理(CRM)、ERP、OA等基础信息化系统,这种大集中系统已为数据挖掘准备了较为成熟的条件。但直接从数据库中截取的数据往往是冗余的、缺失的、有噪声的,从而直接影响数据挖掘的效果。输入数据库中的异常数据、不相关的字段或互相冲突的字段、数据的编码方式等,都会对数据挖掘输出结果的质量产生影响。数据挖掘最后成功与失败,是否有经济效益。数据准备起到了至关重要的作用。从原始数据转化为挖掘信息的流程如图1所示。
图1 数据转化为信息的流程图
由图1可见,在进行数据挖掘之前,必须要做烦琐但却十分重要的数据清洗和预处理工作,包括去掉冗余、弥补缺失值、消除噪声等,进而集成、存储数据,以充分了解数据,保证数据挖掘结果的价值。
3.只要有了数据挖掘工具,就能自动挖掘出所需要的信息
这是人们常有的一个认识误区。数据挖掘利用了统计和人工智能技术的应用程序,它把这些高深复杂的技术封装起来,使人们不用自己掌握这些技术也能完成同样的功能,并且更专注于自己所要解决的问题。虽然如此,人们仍然需要知道所选用的数据挖掘工具是如何工作的。换句话说,数据挖掘永远不会替代有经验的商业分析师或管理人员所起的作用,它只是提供一个强大的工具。数据挖掘决不会在缺乏指导的情况下自动地发现模型。数据挖掘工具要做的就是使这些模型得到的更容易、更方便,而且有根据。比如客户关系管理,不是只设一个客服专线,更不仅仅是把一堆客户基本数据输入计算机。一个完整的客户关系管理运作机制在相关的硬软件系统功能健全的支持之前,要有大量的数据准备工作与分析过程推动。
迈克尔·J·A·贝里和戈登·S·利诺夫指出,通过4种有效途径可以实现数据挖掘技术在企业中的专业化应用,即:从企业外的制造商处购买与企业商业问题配套的评分机制,购买实施整体解决方案的数据挖掘软件,针对特定问题聘请外部专家完成预测模型的建立,以及在组织内部掌握数据挖掘技能。他们认为,从公司长远发展考虑,最后一种方法应作为企业首选。因为这将促使企业把数据挖掘视为企业的法宝,并通过它将客户关系管理推向企业战略的核心。鉴于此,一个企业想要在未来的市场中具有竞争力。必须有一些数据挖掘方面的专家,专门从事数据分析和数据挖掘工作,再同其他部门协调,把挖掘出来的信息提供给决策者参考,但国内的企业还很少有决策人员认识到这一点。如果管理者没有这方面的意识,数据挖掘就很难发挥其应有的作用,且很容易走向两个极端:一是认为数据挖掘没有用处,二是认为数据挖掘是万能的,而得到的结果往往与初始期望相去甚远。
4.企业开发、运用数据挖掘的结果是可以预期的
这也是企业界对数据挖掘认识上的一个惯常误区。实际上,企业界运用数据挖掘要受许多因素的影响,例如,不充足的教育训练、不适当的支持工具、数据的无效性、过于丰富的模型、多变与具有时间性的数据、空间导向数据、数据的衡量性等。面对易变的环境,没有立刻能用的现成的模型,数据挖掘的本质是发现非预期的模式,同样,非预期的模式要以非预期的方法来发现,更不能期望按照程序即能成功。因此,要分析一些潜在的因素,如数据取舍、实体关系性、数量多寡、复杂性、数据质量、可取得性、专家意见等因素,才能做好挖掘工作。此外,所有通过数据挖掘发现的知识都是相对的.是有特定前提和约束条件且面向特定领域的。对于数据挖掘而言,需求牵引、市场驱动是永恒的,而对于企业应用数据挖掘而言,面向客户、讲求实际才是最主要的。
5.数据挖掘是企业商业智能的核心
简而言之,商业智能是能够帮助用户对自身业务经营作出正确明智决定的工具。不可否认,数据挖掘可以增加企业智慧,提升企业竞争优势,是企业走向智能化的重要组成部分。但是一个完整的知识挖掘过程牵涉大量的规划与准备,包括理解数据、融合与核查资料、去除错误或不一致的数据、发展模式与假设、实际数据挖掘工作、测试与审核所挖掘的数据、解释与使用数据等,从这个角度看,数据挖掘只是知识发掘过程中的一个步骤而已,而达到这个步骤前还有许许多多的工作要完成。
从技术层面来看,商业智能的技术体系包括数据仓库、在线分析处理(OLAP)以及数据挖掘3部分。所谓数据仓库就是面向主题的、集成的、稳定的、不同时间的数据集合.它提供在线分析处理或数据挖掘所需要的、整齐一致的数据,用以支持经营管理中的决策制定过程。OLAP则是帮助分析人员、管理人员多种角度地把从原始数据中转化出来、能够真正为用户所理解的、并真实反映数据特性的信息,进行快速、一致、交互的访问,从而获得对数据更深入了解的一类软件技术。而数据挖掘是一种决策支持过程,通过高度自动化地分析企业原有的数据,从中挖掘出潜在的模式,预测客户的行为,帮助企业的决策者调整市场策略,减少风险,作出正确的决策圈。这三者的关系如图2所示。
图2 数据挖掘、OLAP、数据仓库之间的关系示意图
由图2可以看出,数据仓库是商业智能的基础,它是一个环境,主要提供用于决策支持的当前和历史的数据;OLAP属于数据仓库应用,它以数据仓库为基础,其分析结果可以为数据挖掘提供分析信息,作为挖掘的依据;数据挖掘则可以拓展OLAP的深度,可以发现OLAP所不能发现的更为复杂细致的信息。可见,只有将数据挖掘与OLAP、数据仓库结合起来,才能使企业的许多业务流程实现智能化运作。离开了数据仓库和OLAP,商业智能无从实现,因此,数据挖掘、OLAP与数据仓库均是企业商业智能的核心技术。
四、结 论
综上所述,从数据中寻找知识、挖掘财富、发现决策依据。这是数据挖掘对企业的直接贡献,也是企业信息化的重要体现。但在开发、运用数据挖掘的过程中,应充分认识数据挖掘的本质及局限性,正确地对其进行定位,才能真正发挥数据挖掘的决策支持作用。体现其在企业信息化中的价值。首先,数据挖掘仅仅是一个工具,它不能包罗万象,解决所有的商业信息问题,企业应首先明确用数据挖掘解决什么样的商业问题,同时还需要对企业业务的深入了解和数据分析经验;其次,为了保证数据挖掘结果的价值,必须要了解数据,保证数据的质量,数据挖掘最后成功与失败。数据准备起到至关重要的作用;再次,数据挖掘工具并非能自动挖掘出所需要的信息,也不会在缺乏指导的情况下自动地发现模型,还必须有一些数据挖掘方面的专家,专门从事数据分析和数据挖掘工作;然后,企业在应用数据挖掘时要受许多因素的影响,故其结果并不是可以预期的,面对易变的环境,企业要分析一些潜在的因素,面向客户、讲求实际;最后,数据挖掘虽然是企业走向智能化的重要组成部分,可以说数据挖掘是目前企业信息化的高级境界,但不能说数据挖掘就是商业智能的核心所在,一个完整的知识挖掘过程牵涉大量的规划与准备,实际的数据挖掘只是较大规模商业智能过程中的一部分。只有将其与数据仓库、在线分析处理融合在一起,才能构成完整的企业决策分析环境。
免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。