首页 > EA > 正文

大数据不仅仅是大流量

2012-09-19 14:56:09  来源:机房360

摘要:大数据——被定义为是超越了其能力的数据集,典型的数据库软件工具捕捉、存储、管理和分析,最常见的是PB级的艾字节(exabytes)大小,是非结构化分布式和扁平架构模式。
关键词: 大数据

    大数据——被定义为是超越了其能力的数据集,典型的数据库软件工具捕捉、存储、管理和分析,最常见的是PB级的艾字节(exabytes)大小,是非结构化分布式和扁平架构模式。随着大数据的持续增长,行业预期其将为企业带来巨大的和未开发的价值。根据infineta的报告显示,大多数企业将在未来的12至18个月重点采用大数据技术。


    所有这些数据需要采集,存储,处理和分发,有可能堵塞网络。Hadoop管理每petabye字节的大数据大约需要0.5Gbps的带宽,Hadoop是一个大规模计算的开源平台。带宽需求可以影响企业广域网中的延迟时间、速度和可靠性。


    研究结果显示,快速发展的趋势将影响到整个数据中心行业。这些主要的发展趋势包括:


    存储价格日趋便宜。传统的数据存储运行每GB的字节成本大约为5美元,而采用Hadoop存储相同的存储量,每GB的成本仅为0.25美元。


    增强的可扩展性。Hadoop采用预付一小部分费用的形式,使企业能够添加额外的存储空间。Hadoop的可扩展性,可能会导致在未来五年内,全球50%以上的数据都存储在Hadoop环境中。


    缺乏分析。只有百分之一到百分之五的外部收集的大数据实际上是进行了分析。由于缺乏分析,有相当一部分有价值的数据被遗漏。根据麦肯锡最近报道显示,如果医疗保健行业对他们的95%的未捕获的数据进行了分析,那么估计每年将创造出3000亿美元的价值。另一个缺乏分析的例子是石油工业领域,石油钻井平台每秒产生25000个数据点,但石油企业对于这些数据的使用率仅仅只有5%。


    该报告认为,企业部署Hadoop集群提供一个集中式的服务,使个别部门不用再建立和运行自己的大数据服务,并认为当涉及到处理批量工作负载时“越大越好”。


    这种设置带来了大流量——数据在集群之间移动,在数据中心内部和数据中心之移动,包括但不限于复制和同步,这将变得尤其重要,因为Hadoop成为企业级存储的一个重要的因素。大流量移动数据服务支持大数据分析,合规性要求,高可用性服务和安全服务。


第三十四届CIO班招生
北达软EXIN网络空间与IT安全基础认证培训
北达软EXIN DevOps Professional认证培训
责编:liangxuejuan

免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。