大数据需要分析云平台
大数据需要分析云平台
2012-04-11 10:15:56 来源:CIO时代网抢沙发
2012-04-11 10:15:56 来源:CIO时代网
摘要:分析这个词,是在大数据或是云计算里面,必须要提到一个战略高度来认识的词。如果你的云计算平台没有考虑如何对存储下来的一些数据进行分析的话......
关键词:
大数据
大数据需要分析云平台
分析这个词,是在
大数据或是云计算里面,必须要提到一个战略高度来认识的词。如果你的云计算平台没有考虑如何对存储下来的一些数据进行分析的话,那你存的又是什么?如果你没有办法把这里面的价值挖掘出来的话,你怎么区分一个是金矿,一个是垃圾堆?我存了大量的垃圾能够有用吗?当然,没有用处的。
大数据面临的问题之一就是如何对数据进行快速地采集。数据的采集是非常困难的事情,对比现在的数据库水平和数据增长的趋势,可以看出,数据增长速度比我们现在数据库的处理能力要大得多。
这里,大家可以看到一些耳熟能详的关健词,像Hadoop、MapReduce,像Sybase IQ代表的列式数据库,还有Sybase Event Stream Processor事件流处理器,怎么样对流数据进行实时的加工,都是企业现在需要掌握的一些技术。
大数据的分析还有一些周边的、外延的工具,比如说像Matlab、SAS、SPSS或者现在非常火的Revolution R。开源的里边有Hive、SciPy,Mahout、AMPL等等这些技术,在不同的领域里面都有很多人在研究、在分析着。
信息价值的挖掘有很多方法论和手段,比如说怎么样去做社交媒体的分析,怎么样去做行为分析、情绪分析。还有就是业务场景上个性化的服务、个性化的分析、个性化的推荐等等。
现在的数据库市场在面临这么大的数据,这么复杂的数据类型,以及这么快的变化面前,已经不再是一统天下的格局,没有一个数据库产品,或者没有一种数据库产品可以完全地解决
大数据的问题。未来的格局可能是什么呢?
在一个企业或者是像一个IDC这样的架构里边,必须要面临一个工具箱的状态,这个工具箱里面有各种各样的工具,每个工具的体验点都是不一样的,互相之间几乎是不可取代的。现在的数据库市场也面临这样一个格局,很多时候做OLTP,要用行式数据库,做大量的数据分析时要用列式数据库,因为它可以带来十倍、百倍的速度提高。
那么对
大数据实时的处理,我们要用做数据流的分析数据库、内存数据库;在手机上或者说一些移动设备上要想做一些小的应用,我们需要一些嵌入式的数据库;还有面向对象数据库等等。在
大数据的处理格局下,大家必须要接受这样的一个观点,就是专项的数据库用于解决专项的问题。
第三十八届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训
责编:fanwei
免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。