数据行业被认为是增长最快、价值数十亿美元的行业之一。许多公司和组织正尝试充分利用已有数据,确定仍需捕获和存储哪些数据。与此同时,数据科学家仍然迫切需要了解数字,挖掘针对棘手业务问题的可能解决方案。最近一项研究表明,2020年大多数高科技工作需要数据科学技能。
数据科学领域确实有很多令人兴奋的机会。但在进入数据科学领域前,有必要看看以下问题,以评估数据科学是否真的适合你。
1. 什么是数据科学?
数据科学是一个广阔的领域,包括几个细分领域,如数据准备和探索、数据表示和转换、数据可视化、预测分析、机器学习、深度学习、人工智能等。数据科学能力可分为三个等级:1级(初级);2级(中级);和3级(高级)。
2. 数据科学家的职责
数据科学家利用数据得出有意义、有见地的结论,从而推动机构或组织的决策过程。他们的工作职责包括数据收集、数据转换、数据可视化和分析构建预测模型,提供行动建议,基于数据实施建议。数据科学家在不同的部门工作,如医疗保健、政府、工业、能源、学术界、技术、娱乐等。
一些雇佣数据科学家的顶级公司有亚马逊、谷歌、微软、Facebook(脸书)、LinkedIn(领英)、Twitter(推特)、Netflix(网飞)、IBM(国际商业机器股份有限公司)等。
3. 数据科学家的职业前景
数据科学家的职业前景非常乐观。IBM预测,到2020年,数据科学家的需求量将激增28%。最近使用LinkedIn求职工具进行的一项研究表明,2020年大部分的高科技工作需要具备数据科学技能,包括商业分析、机器学习和云计算。
4. 数据科学家的收入
数据科学家的收入取决于所在组织或公司、教育背景、经验年限以及所担任的特定职务。数据科学家的年薪在5万美元至25万美元之间,平均约为12万美元。
5. 如何为数据科学职业做准备
大多数数据科学或商业分析项目需要以下条件:
高水平的定量能力
解决问题的心态
编程能力
有效沟通的能力
团队合作能力
6. 应该重点关注哪些编程语言?
如果你对学习数据科学基础感兴趣,需要从某个地方开始。不要被数据科学家招聘广告中提到的荒谬编程语言清单所吓住。虽然学习尽可能多的数据科学工具很重要,但笔者建议从一种或两种编程语言入手。
当你打下扎实基础之后,就可以挑战自己,学习能够增强技能的不同编程语言、平台或高效工具。笔者认为,Python和R两种编程语言在数据科学运用中仍位居前列。我建议从Python开始,因为越来越多的学术训练项目和行业将Python用作数据科学的默认语言。
7. 成为数据科学家要多长时间
如果你有扎实的分析学科背景知识,如物理、数学、工程、计算机科学、经济学或统计学,基本上可以自学数据科学的基础知识。你可以从edX、Coursera或DataCamp等平台上学习免费的在线课程。
6到12个月内可达到初级水平,7 -18个月内可达到中级水平,18- 48个月内可达到高级水平。达到一定水平所需的时间取决于教育背景以及愿意在数据科学研究上投入的时间。通常,具有分析学科背景的人,如物理、数学、科学、工程、会计或计算机科学,需要的时间比不具有数据科学背景的人要少。
8. 当项目遇到瓶颈,我是否有耐心可以坚持下去
数据科学项目周期可能会很漫长,且要求很高。从问题框架到模型构建和应用,整个过程可能需要数周甚至数月,具体时间取决于问题的规模。作为一名实践数据科学家,不可避免地会碰到项目瓶颈。耐心、坚韧和毅力是成功开展数据科学事业必不可少的关键素质。
9. 我是否具有一定的商业头脑,可以从一个模型中得出有意义的结论,为组织带来重要的数据驱动型决策?
数据科学是非常实用的领域,谨记,你可能非常擅长处理数据以及构建良好的机器学习算法,但作为数据科学家,实际应用至关重要。每个预测模型都必须产生在现实情况下有意义且可解释的结果。必须针对现实对预测模型进行验证,才意义重大。
数据科学家的角色是从数据中提取有意义的见解,这些见解可用于以数据为依据的决策,从而提高公司效率,或改进业务开展方式,或帮助增加利润。
10. 我有良好的沟通能力吗?
数据科学家需要能够跟团队的其他成员或组织中的业务主管交流想法。良好的沟通能力将起到关键作用,以便能够向很少或根本不了解数据科学技术概念的人们传达和展示技术性强的信息。良好的沟通能力将有助于与其他团队成员,例如数据分析师、数据工程师、现场工程师等营造团结协作的氛围。
11. 我是一名终身学习者吗?
数据科学是一个不断发展的领域,因此请准备好接受和学习新技术。与该领域的发展齐头并进的一种方法是与其他数据科学家建立网络。某些可以建立这种网络的平台包括LinkedIn、GitHub和medium(TowardsData Science和Towards AI出版物)。这些平台对于获取有关该领域最新动态的信息大有裨益。
12. 我能成为团队的一员吗?
数据科学家将在数据分析师、工程师、主管的团队中工作,因此你需要良好的沟通技巧,此外也需要成为一名好的倾听者,尤其是在项目开发的早期阶段,你需要依靠工程师或其他人员来设计和构筑一个好的数据科学项目。
成为一名好的团队合作者有助于你在商业环境中得心应手,并与团队中的其他成员以及组织的主管或董事保持良好的关系。
13. 我遵守道德规范吗?
数据科学必须考虑道德和隐私。你需要了解项目的含义,对自己诚实,避免操纵数据或使用有意产生偏差的方法。从数据收集、分析到模型构建、测试和应用的所有阶段,都要遵守道德规范。避免出于误导或操纵观众的目的捏造结果。解释数据科学项目的发现时要遵守道德规范。
14. 有哪些资源可供学习数据科学?
如果情况允许,可以攻读数据科学或商业分析硕士学位。如果负担不起硕士学位课程,则可以自学数据科学。通常,如果具有诸如物理学、数学、经济学、工程学或计算机科学等分析学科的扎实背景,并且对探索数据科学领域感兴趣,那么最好的方法是从大规模开放式在线课程开始。
在建立坚实的基础后,你可能会寻求其他方法来增加知识和专业技能,如可以从教科书中学习,从事项目以及与其他数据科学领域的有志者建立联系。
第三十八届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训
责编:zhangwenwen
免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。