首页 > 大数据 > 正文

数据科学家一将难求

2012-09-18 13:51:22  来源:CIO时代网

摘要:数据科学是一门交叉学科,涉及统计学、计算机科学以及特定领域的专业知识等。受到广泛关注的大数据专业人才是数据科学家。
关键词: 数据挖掘 数据科学

    受到广泛关注的大数据专业人才是数据科学家。


    “什么是数据科学家?”Bitly公司的首席数据科学家Hilary Mason负责从Bitly收集的数据中寻找价值并建立系统,“我的团队负责建立数学模型,编写代码并开发基于信息的产品系统。”


    数据科学是一门交叉学科,涉及统计学、计算机科学以及特定领域的专业知识等。Hilary Mason将数据科学划分为两部分:一部分是分析,另一部分是从数据中提取具有洞察力的新技术,这在以前是不可能做到的。数据科学是分析能力和新算法的结合体。


    数据科学家的工作就是要提出正确的问题。如果我问这样一个问题,这个链接的点击数是多少?这就不是一个关于数据科学的问题。如果我问这样一个问题,根据这家出版商网站之前的历史链接,我们能否预测未来三小时内将有多少来自法国的用户读到这个内容?这就是一个有关数据科学的问题。


    CDO的职责是为企业的业务和数据提供更好的价值平台。通过CDO的工作,企业能将数据转化为业务语言,被管理层更好地理解和运用。因此,企业对CDO的数据业务专业性要求并不高。而数据科学家是专业数据的研究者,其主要工作是对数据及其价值的专业性进行研究,比如数据科学家队伍中包括数据分析师、数据挖掘师、数据可视化设计师等。


    许多大型的公司有市场、销售、财务、人力资源、服务、供应链和生产管理等多个职能部门。所有职能部门都是共同协作的,而不是独立存在的,这有点像人体中的各种器官。数据会在各个职能部门的不同系统间流动。CDO的职责是在这些职能部门的数据中发掘价值,并制定战略决策。并不是有大数据应用的企业都要设立一个CDO职位。一般情况下,CDO会向CTO或CEO汇报工作。“Informatica虽然专注于数据集成业务,与大数据打交道最多,但是Informatica公司并没有专职的CDO.托尼·杨介绍说:”过去,我们有一个人专门负责数据管理,其职能与CDO类似。这是一项要求非常高的工作。负责数据管理的这个人必须具备多种能力,并且要全面了解公司的业务运作流程,此外还要跟踪流动的客户数据,掌控一个产品的全生命周期。“通常情况下,CDO的主要职责包括以下内容:确定公司在数据系统上的战略重点,从数据中挖掘出新的商机,通过数据优化实现业务创收,将数据作为一项战略资产进行管理。”帮助企业参透数据和信息中隐藏的问题,这对CDO来说是最关键的职能之一。因此,能够胜任CDO这个职位的人很难找到。“托尼·杨感叹说。[page]
    数据科学家独一无二

    作为与CDO关系最为紧密的一类专业人员,数据科学家可以与CDO一起工作,解决企业需要洞察的问题。”在描述与大数据打交道的人应该具有的能力时,我经常用Insight(洞察力)这个词。“托尼·杨举例说,”我们将相互关联的、实时的客户信息发送给呼叫中心的职员,他们就能全面掌握客户的情况,从而为客户提供更优质的服务。这似乎听起来容易,但实现起来十分困难。“数据科学家能够解决复杂的数据问题,但与CDO相比,它更像是高级工程师或高级技术人员,因为CDO的工作内容中还有一部分是进行公司管理和战略决策,而这不属于数据科学家的工作范畴。谈到数据科学家应该具备的能力,托尼·杨将其归纳为以下几点:第一,数据科学家不是传统的IT人士,它的工作中既包含IT的成分,也包含业务的成分;第二,数据科学家具有很强的逻辑分析能力,能够了解数据和信息如何与企业的业务产生关联;第三,数据科学家还拥有其他多种能力,既了解信息、业务以及数据如何在企业中流动,也知道如何将信息整合在一起,这是数据科学家拥有的独一无二的能力。


    上世纪90年代,有很多IT项目、ERP项目都没有成功实施。究其原因,是因为那时没有能够全面了解业务流程的专家,企业只能自己边实施边了解。现在则不同,企业如果想实施ERP项目,就可以马上找来相关的专家、工程师和技术顾问等。这些人很清楚如何去实施ERP项目。一个项目从头到尾,可能9个月就能全部完成,而这在上个世纪90年代是绝不可能办到的事。”现在,很多企业能够轻而易举地完成某个复杂的项目,这是因为有一个团队在做,而且整个产业链中的很多公司也清楚如何去实施。“托尼·杨分析说,”但是对于大数据来说,它还处在发展的初期阶段,没有现成的模式可以借鉴,企业还需要一段时间去摸索和实践。“


第三十八届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训
责编:zhangyexi

免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。