2012-09-19 14:05:21 来源:互联网
尽管大数据研究越来越成为主流,我们仍能从硅谷的数据科学家那里学到很多经验教训,因为他们所从事的职业大都依赖大数据才得以生存。虽然与更传统些的商业模式相比,他们运用数据的方式存在很大不同,但他们积累了足够的科学知识和技术,值得刚刚投身于大数据业务的后来者学习和借鉴,借以尽可能规避失败的风险。
那么,公司如何才能围绕大数据重构商业模式,或者如何重新思考商业经营理念?针对这一问题,大数据以及数据科学领域的专家持何种观点?结合IE Group创新会上的所闻所见,可以归结出5大理念,助你运用好大数据。
一、Hadoop并不意味着一切
虽说这一观念如今应该是业内常识,但仍需不断重复,以便铭记于心。当论及Hadoop最大拥护者、Fayyad前雇员(时任首席数据官)Yahoo如何在这方面得到惨重教训时,ChoozOn公司的CTO Usama Fayyad深入探讨了这一观点。Yahoo原本试图借助Hadoop做一些客户细分方面的工作,却发现,相较于采取更传统的数据库架构做同样的工作,成本竟然高出50倍。认识到这点后,这个项目最终被否决了。后来,数据分析初始企业nPario复活了此种项目,如今,Yahoo已成为nPario的付费用户。
二、大数据使数据科学变得更亲和
Sparked.com网站的首席数据科学家Daniel Wiesenthal清晰阐述了大数据和数据科学这两个不时会重合的概念,他认为,从本质上讲,诸如支持向量机(SVM)以及类神经网络类的技术,都是经时间检验而且被证实切实有效的方法,可用来“从数据库中获取细致到最后每一‘盎司’的信息”,即使这些数据库规模很小。这些技术非常复杂,而且很难被口头解释,在一定规模下还会趋于失效。
然而,大数据使数据科学家们得以运用更简单的模型技术,比如决策树或者回归技术,以便更精确地做大量数据账目管理,使其更具统计意义,而不是仅为追求超级复杂的演算系统。Wiesenthal认为,运用Hadoop之类的通用大数据技术,意味着大数据科学家可以更快地开发和测试模型,因为这种架构不需要与特殊的规则系统或者类型问题相协调,它只是被设计用来更好地处理大数据。
三、知道如何做减法有时更为重要
作为SaaS的市场先锋,Salesforce.com一直在运用自己的大数据平台监测各种产品性能付诸实施的情况,产品管理主管Narayan Bharadwaj认为,这么做的目的不仅是希望预测下一步应该添加什么功能,更多则是为利用数据来支持决策,那些不能帮助公司有所提升的功能将被鉴别出来,相关资源被转投到更具价值的功能上去。“知道如何做减法有时更为重要。”他说。
下一步该怎么做?依照逻辑,自然是分析鉴别功能特性,包括实施良好的和实施效果欠佳的,在布局未来远景时,公司因此会获得一个基本认知,什么样的设计会有成效,什么样的设计反之,由此趋利避害。
四、内容决定价值
简单来说,如果用户事先就知道某些内容为什么会被展示给他们,或者为什么他们会被作某种推荐,他们或许更有可能为此买单。StumbleUpon麾下的一位高阶数据科学家表示,为将相关度最高的网页内容呈现到每位用户面前,公司在大数据及数据科学技术方面投入大量人力、物力,但事实证明,如果寄希望于用户信任这种服务决策方式,仅这么做还远远不够。Sparked.com的Wiesenthal在其论述中同样指出了这一点,他认为诸如Pandora与Netflix这类的服务之所以流行,原因部分在于,在推荐类似内容的时候,它们实际上都向客户传递了自己的一些特性。
五、交易数据远胜研究数据
PayPal的首席科学家Mok Oh论述了从产品研究到购买的产业链,以及从产业链一端努力走向另一端时,决策信号为什么变得越来越难以辨别。PayPal试图跨越这一障碍,做法如下:首先从交易过程着手,然后综合其他数据(包括内部数据以及由Facebook以及Gnip等处得来的外部数据资源),尽可能鉴别出哪些人是真正的客户,以及哪些产品或服务是这些客户真正需要的。他认为,相对于Google努力追踪客户购买行为的研究,这样做更容易些,当然,在另一种情况下例外,如果客户确实使用像Google Wallet这样的工具购买了某些商品,后一种研究方式更易操作。
将柠檬汁从柠檬汽水中分离出来,这正是大数据研究所要做的。一个公司所拥有的最有价值的数据资源,就是它针对自身业务特别搜集的数据,大数据处理的成功之路在于,从利用这些数据开始,探索出一些创新方式,然后深入发掘出更具洞察力的内涵。
免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。