首页 > 大数据 > 正文

什么是Hadoop?

2012-12-25 10:05:49  来源:CIO时代网

摘要:处理海量数据大数据的技术,现今最火红的则非Hadoop莫属。Hadoop技术的诞生则是因为因特网数据的爆炸性成长,传统的文件系统无法负荷储存跟分类。
关键词: Hadoop 大数据

    处理海量数据大数据的技术,现今最火红的则非Hadoop莫属了喔!


    根据Hadoop的创办人Doug Cutting所言“Hadoop”就只是帮一只黄色的填充大象取的名字而已,没有什么特别的意思纯粹只是好记而已。而Hadoop技术的诞生则是因为因特网数据的爆炸性成长,传统的文件系统无法负荷储存跟分类,从而根据Google搜寻器的相关的学术论文为蓝图,演变成一套如何储存、处理、分析TB(Tera Bytes)甚至PB(Peta Bytes)等级的数据处理方法。


    Hadoop是百分之一百免费由Java程序语言所编写的Open Source,一种从根本结构上与现存技术不同且先进的储存、处理、分析海量数据的技术,执行Hadoop使用者无须仰赖昂贵的或是具有专利的软硬件平台,Hadoop可以在便宜且工业规格化的服务器群上执行平行数据处理以及分析,有了Hadoop没有什么数据量是过大的,在现今资料量爆炸的时代企业、学术、政府等组织可以利用从之前被认为是无用的资料找出从来没被发现的参考价值。


    Hadoop基本上可以处理任何数据型态,不论是结构化或是非结构化,log纪录文件、照片、声音、通讯纪录或是电子邮件。不管是什么数据你都可以汇入HadoopCluster并且不用作任何前处理,它就会帮你回答你从来不曾想过的问题!Hadoop把看似毫无关联的资料背后所隐含的讯息呈现出来,用户便可以根据更多的参考资料做出对应决策了。


第三十八届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训
责编:zhangyexi

免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。