加入收藏 | 设为首页 | 会员中心 | 我要投稿 应用网_阳江站长网 (https://www.0662zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 站长资讯 > 评论 > 正文

给毕业生:你应该选机器学习还是数据科学?

发布时间:2020-08-13 14:22:03 所属栏目:评论 来源:站长网
导读:随着数据科学行业自 2013 年以来的爆炸式流行,该行业一直不断地朝着更宽泛的方向发展,但同时也逐渐出现了更具体的职业角色分化。本文首先分析了数据科学行业的总体发展趋势,然后深入地比较了机器学习领域中几个不同名称的职位的职能,对寻找数据科学和

正如这篇文章所描述的,如今作为一名数据科学家,你并不一定非要成为一名优秀的程序员。那是因为,以前用来分析大数据的工具和方法并不是那么随处可得且用户友好。这就要求从前的数据科学家在拥有其他技能的同时还需要具备较强的工程技能。但是用于机器学习和数据科学的工具发展十分迅速,现在比以往任何时候都更容易获取这些工具,因此你只需几行代码就可以访问使用最先进技术(State of the art,SOTA)的模型。这使得以前的数据科学家角色如今更容易分拆成为分析师或工程师。现在,我们不必像以前那样,需要全面掌握所有分析、工程和统计知识才能成为一名数据科学家。

例如,Facebook 就引领了这一趋势的变化,让过去的数据分析师的工作角色变成了数据科学家。这是一个自然的演进过程,因为随着数据量的增加以及数据问题变得更具挑战性,执行良好的数据分析需要更多的专业技能和培训。不仅仅是 Facebook,像苹果和 Airbnb 这样的公司也已经开始明确区分数据分析师 / 产品数据科学家和机器学习数据科学家这样的角色岗位。

公司规模如何影响岗位的分化

值得一提的是,这样的角色岗位细分更多发生在规模较大的科技公司。数据科学家这个角色和软件工程师还是有很大差异的,固然各种大小规模的科技公司都需要软件工程师,但并不是所有公司都需要专业的研究科学家或机器学习工程师。许多公司拥有几名数据科学家可能就足以运转业务了。所以在小公司里,可能仍然会有一些数据科学家同时扮演上述四个角色。

根据一般的经验而言,大公司(FANG 四巨头:Facebook,Amazon,Netflix 和 Alphabet)的数据科学家职能通常类似于高级分析师,而小公司的数据科学家扮演的角色更类似于机器学习工程师。当然这两种职能对于公司来说都是重要和必需的。接下来,我将继续沿用这里我的新定义,即下文每当提及数据科学家时,意味着这是一个分析师角色。

数据科学家分化出的不同角色以及如何选择

在下面的图表中,我试图展示一个与上面的图表类似的图,但对这四种功能增加了更详细的描述。这些描述内容可能并不算完美,但你可以把它们作为参考。

数据科学家职能的四大支柱(资料来源:本文作者)。

求职——应该选择哪个职位以及如何准备面试?

如果你试图进入这个领域,无论是当一名机器学习工程师还是数据科学家,你可能首先想知道的是自己究竟应该选择哪一个岗位。请让我列出四个与机器学习相关的主要岗位简化的(但也是约定俗成的)描述,以帮助你弄清楚这些职位到底是干什么的。虽然我个人在工作中并没有将所有这些职位都尝试干过一遍,但我从工作在各个领域的朋友那里学到了很多有用的知识。我还在以下描述中的括号里提供了可能的面试内容(假设是典型的四轮面试)。

数据科学家: 你想分析大数据、设计实验和 A/B 测试、构建简单的机器学习和统计模型(例如使用 sklearn)来推动商业策略的运筹帷幄吗?这个角色的工作不会特别结构化,会包含较多的不确定性,你需要能够独当一面地去主导项目的表述。(面试:1 轮概率 / 统计,1 轮 Leetcode 编程,1 轮 SQL,1 轮机器学习。)

2. 机器学习工程师: 你想在实际业务中构建并部署最新的机器学习模型(例如 Tensorflow,,PyTorch)吗?你工作的重点不仅是构建模型,而且还需要编写软件以运行和支撑你的模型。在这个职位上,你更像是一个软件工程师。(面试:3 轮 Leetcode 编程,1 轮机器学习。)

3. 研究科学家: 你有计算机科学专业的博士学位,并在 ICLR 国际会议上发表过几篇机器学习相关的论文吗?你是否致力于突破机器学习的研究前沿,当你的论文被别人引用时会感到兴奋不已吗?能做到这些的人的确是凤毛麟角,相信如果能做到这些,你已经很明确自己想干什么样的工作了。而这类人才中的大多数最终都进入了谷歌或者 Facebook。而且,即使没有博士学位也可以进入这个行业,但这样的情况少之又少。(面试:1 轮 Leetcode 编程,3 轮机器学习 / 研究。)

4. 应用科学家: 你是机器学习工程师和研究科学家的混合体。所以这个角色不仅要关注编程,还需要去使用和推进最前沿(SOTA)的机器学习模型。(面试:2 轮 Leetcode 编程,2 轮机器学习。)

显然,以上这些描述并不算面面俱到。但当我和朋友聊起相关职位,看过很多工作描述后,我发现上述这些观点还是普遍适用的。如果你对自己想要申请的职位还是有些不太确定,这里我还有一些建议可以帮助你进一步了解工作职位:

阅读职位描述:说实话,职位头衔并不重要。这些职位统统可能都被冠以相同的“数据科学家”字眼,但工作角色描述可能相去甚远。挖掘 LinkedIn:如果你不确定苹果公司招聘的数据科学家是什么样的角色,只要看看苹果公司的数据科学家在 LinkedIn 上有什么样的专业背景就可以了。他们是否大多都是计算机科学专业的博士?或者是本科生学历?他们都接受过什么样的专业培训?这些信息将有助于你了解更多。面试:如果你认为你应聘的职位是一个技术岗位,但在面试过程中却没有遇到任何编程技术面试,那你多半不会在此得到一个技术职位。通常你的面试内容就反映了工作的性质。

机器学习工程师 vs 数据科学家

好吧,已经说得够多了。现在回到我们的话题上来。近年来,我开始听到人们对数据科学工作的负面评价越来越多。造成这种情况的几个原因是,越来越多冠以“数据科学家”的工作岗位貌似并不像从前一样包含许多高端的机器学习成分,而且这样的职位似乎比以前更容易获得。也许五年前,大多数招聘岗位描述会要求至少有硕士学位才能应聘数据科学家的工作,但现在情况已经大不一样了。不管人们如何揣测数据科学(至少在过去日子里)热度已过的原因,请让我们先来看一些实际数据。

下面的数据和图表来自世界著名的薪资数据库搜索引擎,Salary Ninja。它根据 H1-B 数据库中全美的外籍员工的信息进行搜索。你会看到 2014 年至 2019 年,职位名称中含有“数据科学家”或“机器学习工程师”的职位的数量和平均工资。

比较数据科学家和机器学习工程师的工作机会变化趋势(资料来源:本文作者)。

(编辑:应用网_阳江站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读