首页 > 大数据 > 正文

大数据 时尚代名词

2013-07-17 10:59:18  来源:支点网

摘要:CIOI:如今,很多事情都想与大数据沾边,不管是各种国内外IT会议论坛,还是热点话题。对于目前无处不在的大数据,你怎么看?
关键词: 大数据

    CIOI:如今,很多事情都想与大数据沾边,不管是各种国内外IT会议论坛,还是热点话题。对于目前无处不在的大数据,你怎么看?


    刘德寰:首先,大数据不是新事物,天文学、地质学、量子物理、基因学等领域早已有这个概念。现在的大数据热潮主要指的是互联网领域的大数据,与上述领域的大数据不同的是,因为人的复杂性,这个领域的大数据挖掘会更加困难。既然是关于人的研究就需要应用研究人的方法梳理大数据


    “大数据”一词我不十分同意,没有一定之规。主要是相对于原来统计软件的局限而形成的一个词汇。由于现在互联网痕迹的增加,数据已经对原来的统计软件形成了挑战,所以“大”是一个相对值。


    如你所说,如今大数据已经无处不在,它已然成为一个时尚词汇,而且很多人对于大数据存在理解混乱。


    CIOI:你所指的理解混乱包括哪些方面?


    刘德寰:现在谈到大数据,基本有四个混乱观念:第一,大数据是全数据,忽视甚至蔑视抽样;第二,连续数据就是大数据;第三,数据量级大是大数据;第四,数据量大好于量小。与之相对应的是:抽样数据只要抽样合理,结论就是准确的;连续只是一个数据结构;大量级的噪音会得出错误结论;大小与价值关系不大。


    CIOI:也就是说,对于维克托。迈尔。舍恩伯格在《大数据时代》一书中提出的三组重要对比(注:因果关系VS相关关系,随机样本VS所有数据,精确性VS混杂性)你否定了其中两组,那对于“不是因果关系,而是相关关系”这个观点,你有什么要说?


    刘德寰:舍恩伯格在《大数据时代》一书中提出的被广泛接纳的:大数据“没有精确只有混杂,没有因果只有相关”观点是错误的,混杂的数据需要经过梳理成合理的数据才有分析价值,无论是牛顿、爱因斯坦,还是韦伯的理想类型都是在混杂中找寻分析方法,相关关系很多时候是在没有找到因果之前的认识,因果与过程理解是研究的核心。


第三十八届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训
责编:renjizhong

免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。