一图读懂:如何成为一名数据科学家?

2015-10-21 DataScienceCentral DataScienceCentral

数据科学和数据分析发展迅速,给该领域带来了众多工作机,但是可用人才匮乏。这给那些想找新工作的人提供了希望。 但是如何才能成为一个数据科学家呢? 首先,每个企业对数据科学家的定义都不同,并没有统一的概念。但是,一般来讲数据科学家结合了软件工程师和统计学家的技能,以及相关领域的专门知识。 约90%的数据科学家至少是本科学历,有些甚至是博士,但是他们获得学位的领域非常广泛。有些招聘单位甚至招募

数据科学和数据分析发展迅速,给该领域带来了众多工作机,但是可用人才匮乏。这给那些想找新工作的人提供了希望。

datascientist

但是如何才能成为一个数据科学家呢?

首先,每个企业对数据科学家的定义都不同,并没有统一的概念。但是,一般来讲数据科学家结合了软件工程师和统计学家的技能,以及相关领域的专门知识。

约90%的数据科学家至少是本科学历,有些甚至是博士,但是他们获得学位的领域非常广泛。有些招聘单位甚至招募那些可塑性强、有创造力的人文学科人才。

除了数据科学学位课程,要成为一个数据科学家还需要哪些步骤呢?

  1. 提高数学和统计学技能。一个好的数据科学家必须能理解数据的含义,为了实现这一点,你必须有坚实的线性数据基础,掌握算法和统计学技能。特定的职位甚至需要更高的数学水平,但是这是一个好的开始。
  2. 掌握机器学习的概念。机器学习是一门新兴学科,和大数据紧密相关。数据学习使用人工智能算法将数据转化成价值和知识。
  3. 学习代码。数据科学家必须了解如何操作代码来告诉计算机如何分析数据。从Python这样的开放资源语言开始深入学习。
  4. 了解数据库、 数据湖和分布式存储。数据储存在数据库中、数据湖或跨分布式网络中,数据存储是如何建立的决定了数据的访问、使用和分析方式。建设数据存储时如果不了解宏观图景或远景会产生深远影响。
  5. 学习数据改写和数据清理技术。数据改写是将原始数据转化成其他更容易访问和分析的数据类型的过程。数据清理则有助于删除重复和“坏”数据。这两项技术都是数据科学家工具箱里至关重要的工具。
  6. 了解优秀的数据视图和报告的基础。你无须成为一个图形设计师,但是必须熟悉如何创建能让外行读得懂的数据报告。
  7. 增加工具箱里的工具。一旦你掌握了以上技能,就是时候扩展数据科学工具箱了,掌握包括Hadoop, R 和 Spark这样的程序。了解并体验这些工具将给你带来更多的工作机会。
  8. 练习。在找到工作之前如何练习数据科学呢?从开放资源数据中开发自己的小项目,参与竞争、和那些已经有工作的数据科学家建立联系,参加集训、志愿者或实习生。最好的数据科学家既有经验又要有直觉,能向招募单位展示自己的成果。
  9. 成为社区的一份子。追随行业领袖、阅读行业博客和网站、参与、提问,随时了解当前的新闻和理论。

听起来很麻烦吗?确实是。数据科学并不是科普,需要兴趣和精通,它将产生难以置信的回报。如果没有钱参与大学项目,下边的信息图提供了这些步骤所需的免费资源。

How-to-become-a-data-scientist

版权声明:
本网站所有内容来源注明为“梅斯医学”或“MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明来源为“梅斯医学”。其它来源的文章系转载文章,或“梅斯号”自媒体发布的文章,仅系出于传递更多信息之目的,本站仅负责审核内容合规,其内容不代表本站立场,本站不负责内容的准确性和版权。如果存在侵权、或不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言
评论区 (2)
#插入话题
  1. [GetPortalCommentsPageByObjectIdResponse(id=46307, encodeId=e65a4630e17, content=心之所向, beContent=null, objectType=article, channel=null, level=null, likeNumber=156, replyNumber=0, topicName=null, topicId=null, topicList=[], attachment=null, authenticateStatus=null, createdAvatar=, createdBy=2df21671362, createdName=1de10e9dm19(暂无匿称), createdTime=Tue Dec 15 22:32:00 CST 2015, time=2015-12-15, status=1, ipAttribution=), GetPortalCommentsPageByObjectIdResponse(id=2045250, encodeId=6c8d20452507a, content=<a href='/topic/show?id=99465e75960' target=_blank style='color:#2F92EE;'>#数据科学#</a>, beContent=null, objectType=article, channel=null, level=null, likeNumber=34, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=57759, encryptionId=99465e75960, topicName=数据科学)], attachment=null, authenticateStatus=null, createdAvatar=, createdBy=8e4c53, createdName=jiyangfei, createdTime=Mon Sep 12 03:36:00 CST 2016, time=2016-09-12, status=1, ipAttribution=)]
    2015-12-15 1de10e9dm19(暂无匿称)

    心之所向

    0

  2. [GetPortalCommentsPageByObjectIdResponse(id=46307, encodeId=e65a4630e17, content=心之所向, beContent=null, objectType=article, channel=null, level=null, likeNumber=156, replyNumber=0, topicName=null, topicId=null, topicList=[], attachment=null, authenticateStatus=null, createdAvatar=, createdBy=2df21671362, createdName=1de10e9dm19(暂无匿称), createdTime=Tue Dec 15 22:32:00 CST 2015, time=2015-12-15, status=1, ipAttribution=), GetPortalCommentsPageByObjectIdResponse(id=2045250, encodeId=6c8d20452507a, content=<a href='/topic/show?id=99465e75960' target=_blank style='color:#2F92EE;'>#数据科学#</a>, beContent=null, objectType=article, channel=null, level=null, likeNumber=34, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=57759, encryptionId=99465e75960, topicName=数据科学)], attachment=null, authenticateStatus=null, createdAvatar=, createdBy=8e4c53, createdName=jiyangfei, createdTime=Mon Sep 12 03:36:00 CST 2016, time=2016-09-12, status=1, ipAttribution=)]

相关资讯

预测分析可能代表数据科学未来方向

从SGI的首席科学家John R. Masey在1998年提出大数据(big data)概念,到大数据分析技术广泛应用于社会的各个领域,已经走过了17年的时间。现在再也没有企业怀疑大数据分析的力量,并且都在竞相利用大数据来增强自己企业的业务竞争力。但是,即使17年过去,大数据分析行业仍然处于快速发展的初期,每时每刻都在产生新的变化。从概念到实用、从结构化数据分析到非结构化数据分析,大数据分析技