2012-08-29 14:28:47 来源:eNet硅谷动力
日前,2012 IBM软件技术大会在京举行,会上,IBM大数据项目总监Steven Sit在会上发表了演讲,他提出了企业构建大数据平台的四大必备基础功能。
大数据的不同之处
其实大数据这种现象才是刚刚开始,估计到2015年的时候,全球将会有超过15个ZB的数据容量。我们仔细看现在的数据,许多与传统数据有所不同,一是这些数据的容量以及它们所产生的速度都是在不断的增加;二是除了传统的数据源以外,大数据更加容纳了一大部分新的数据源,像我们所说的社交网站、社交媒体,以至各种各样的智能仪器都在不断产生这些数据;三是这些新的数据有很大一部分,80%是属于非结构性或者半结构性的数据。
基于以上几点,如果企业要在大数据里面找到智慧,必须要引入一些新的技术。对企业来讲是一个新的大数据平台。然而,在这个新的大数据平台里,有哪几方面是比较重要的层面呢?
对此,Steven Sit提出了大数据平台的四大基础功能。
大数据平台的四大基础功能
他指出,大数据平台到底有哪些最主要的功能?
第一,大数据平台必须有海量分析的能力。在这方面IBM是很认同Hadoop System,Hadoop和它的EcoSystem。
第二,大数据很多时候会产生流量的数据,所以企业需要一个流计算的平台或者引进。
第三,针对传统性很密集,而且是结构性的数据,企业需要一个大型的、并行的数据资料库,这也是IBM最近收入了Netezza的一些功能。
第四,80%的数据是非结构性或半结构性的,在这些文本的分析功能方面,企业需要有索引的功能。对此,IBM在最底层需要一些信息整合和信息管理,来加强平台的安全性、整融性。而在这些引进的上层,IBM增加了一些针对不同应用的加速器,而在最上面IBM有一些不同的工具,针对与我刚才所说的数据科学家、开发人员、管理人员的不同开发工具。针对不同行业的加速器,IBM将在今年年底和明年推出一系列针对不同行业,像电信、财务、公共交通、零售业、媒体业的一些加速器。
最后,他谈到,大数据来现在市场的情况是,互联网的一些公司,像雅虎、谷歌,他们都走在大数据的前端,但是有很多像他们的这些应用都是很定型的,而且需要很大量的资源来维护和创建。未来,IBM认为大数据的应用将会分布到企业的每一个角落,而且会被企业的客户直接应用。试想一下,当你的销售人员在他们和你的客户交谈之中,已经深入了解这些客户的个人需求或者这些客户在利用您的商业网站上可以看到他们同类型的客户的购买的历史,而且及时收到一些购买的建议。另外,当您这些客户在接见你们的门市部的时候,他们的手机已经收到及时的广告,提供一些优惠。这些我们现在想来是很遥远的,其实并不是,有很多公司正在做这样的应用。所以我们在不久的未来会看到这些应用会更加普遍。而IBM所扮演的角色,就是为这些企业提供企业级的大数据平台,帮助他们更快的、更有效的分析大量的数据,得到商业智能,然后提供一个开发的环境,让我们的客户能够把大数据的应用推广开来。
免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。