首页 > 大数据 > 正文

大数据精髓,分析信息时的三大转变

2018-09-03 11:06:05  来源:CIO时代网

摘要:在大数据时代,我们可以接触到更多的数据,有时候甚至可以处理分析某个特别现象相关的所有数据,而不再依赖于随机采样。
关键词: 大数据
\
  大数据的精髓在于我们分析信息时的三个转变,这些转变将改变我们理解和组建社会的方法。

  第一个转变

  在大数据时代,我们可以接触到更多的数据,有时候甚至可以处理分析某个特别现象相关的所有数据,而不再依赖于随机采样。

  19世纪以来,当面临大量数据时,社会都依赖于采样分析。但是采样分析是信息缺乏时代和信息流通受限制的模拟数据时代的产物。以前我们通常把这看成是理所当然的限制,但高性能数字技术的流行让我们意识到,这其实是一种人为的限制。

  与局限在小数据范围相比,使用一切数据为我们带来了更高的精确性,也让我们看到了一些以前无法发现的细节-大数据让我们更清楚地看到了样本无法揭示的细节信息。

  第二个改变

  研究数据如此之多,以至于我们不再将精力投入到追求数据精确度上面去。

  当我们测量事物的能力受限时,关注最重要的事情和获取最精确的结果是可取的。

  如果购买者不知道羊群里有几头牛,那么交易势必无法进行。

  直到今天,我们的数字技术依然建立在精准的基础上。我们假设只要电子数据表格把数据排序,数据库引擎就可以找出和我们检索的内容完全一致的检索记录。

  这种思维方式适用于掌握“小数据量”的情况,因为需要分析的数据很少,所以我们必须尽可能精准量化我们的记录。在某些方面,我们已经意识到了差别。

  例如,一个小商店在晚上打烊的时候要把收银台里的每分钱都数清楚,但是我们不会、也不可能用“分”这个单位去精确度量国民生产总值。随着规模的扩大,对精确度的痴迷将减弱。

  达到精确需要有专业的数据库。

  针对小数据量和特定事情,追求精确性依然是可行的,比如一个人的银行账户上是否有足够的钱开具支票。但是,在这个大数据时代,很多时候,追求精确度已经变得不可行,甚至不受欢迎了。当我们拥有海量即时数据时,绝对的精准不再是我们追求的主要目标。

  大数据纷繁多样,优劣掺杂,分布在全球多个服务器上。拥有了大数据,我们不再需要对一个现象刨根究底,指要掌握大体的发展方向即可。

  当然,我们也不是完全放弃了精确度,只是不再沉迷于此。适当忽略微观层面上的精确度会让我们在宏观层面拥有更好的洞察力。

  第三个转变

  我们不再热衷于寻找因果关系。寻找因果关系是人类长久以来的习惯。即使确定因果关系很困难而且用途不大,人类还是习惯性地寻找缘由。

  相反,在大数据时代,我们无须再紧盯事物之间的因果关系,而应该寻找事物之间的相关关系,这会给我们提供非常新颖且有价值的观点。

  相关关系也许不能准确告诉我们某些事情为何会发生,但是它会提醒我们这件事情正在发生。在许多情况下,这种提醒的帮助已经足够大了。

  如果百万条电子医疗记录显示橙汁和阿司匹林的特定组合可以治疗癌症,那么找出具体的药理机制就没有这种治疗方法本身来的重要。

  同样,只要我们知道什么时候是买机票的最佳时机,就算不知道机票价格疯狂变动的原因也无所谓了。大数据告诉我们“是什么”而不是“为什么”。

  在大数据时代,我们不必知道现象背后的原因,我们只要让数据自己发声。

  我们不再需要在还没有收集数据之前,就把我们的分析建立在早已设立的少量假设的基础之上。让数据发声,我们会注意到很多以前从来没有意识到的联系的存在。

  例如,对冲基金通过剖析社交网络推特上的数据信息来预测股市的表现;

  亚马逊和奈飞根据用户在其网站上的类似查询来进行产品推荐;

  推特、脸谱网和Linkedln通过用户的社交网络图来得知用户的喜好。
第三十八届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训
责编:zhangxuefeng

免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。