想成为数据科学家,这 4 个坑千万别踩

2018-07-10    来源:raincent

容器云强势上线!快速搭建集群,上万Linux镜像随意使用
原标题 The 4 fastest ways not to get hired as a data scientist,作者为 Jeremie Harris。

在 SharpestMinds 公司工作期间,我看过许多数据科学方面的求职简历。因为这个平台是基于一个庞大的反馈机制而建立的,我们不断地从发布信息的公司那里得到反馈——不仅是关于他们是否想要面试或雇佣候选人,还有关于他们为什么选择面试或雇佣那些人。

通过了解数百家公司的招聘过程,我们了解到哪些简历是公司所青睐的,哪些简历在审核过程中会被淘汰。

注意:每个公司对员工的要求都不相同。被谷歌雇佣的人可能不会被其他公司录用(甚至可能毫无用处)。因此,试图构建「完美」的通用性数据科学简历几乎是不可能的。

话虽如此,但简历中有些致命错误是相似的,很可能会让你的申请不被考虑。

1. 在简历上堆砌无关紧要的项目

如果你在简历上罗列了过多琐碎而无关紧要的项目,那把你的简历直接淘汰是最快的解决方法。

如果你对此有些疑问,如下这些项目就会成为你的减分项:

•  基于泰坦尼克数据集对幸存者的分类

•  基于 MNIST 数据集进行手写数字分类

•  基于虹膜数据进行花卉种类分类

为什么这些会成为减分项

候选人和招聘人员都清楚,简历上的篇幅是有限的。因此,如果在简历上过多罗列像 MNIST 那样的项目,这可能会让招聘人员会对你的发展潜力产生质疑。

如何解决这个问题

如果你的简历包含这些类型的项目 -,而且恰巧你没有其他更具挑战性和实质性的项目来替换它们 . 这说明你需要花些时间做一些项目,让自己的简历更具有说服性。 当然,如果你有其他更有趣的项目来进行展示,那么你肯定会想用他们进行代替。

例外

当然了,利用 MNIST 或泰坦尼克号数据集也能构建复杂的项目。如果你在项目中使用了一种你自己发明的新型 GAN,或者重现了胶囊网络的论文。那就进行大胆的尝试吧。 但是请记住,大多数招聘人员都不是技术人员,他们通常只是通过寻找简历中关键字来工作,因此您必须明确注明您的 MNIST 项目不仅涉及简单的数字分类任务。

2. 在简历中列出 Udacity 或 Coursera 项目

像 Udacity,Coursera 和 deeplearning.ai 这样的大规模在线开放课程是进行深度学习和数据科学深入学习的绝佳方式。话虽如此,如果你只在简历里罗列这些经历,那么招聘人员可能会你产生怀疑。

因此 如下这些事情要避免:

简历中的大部分项目都是你的纳米学位或其他在线课程完成的内容

很显眼地列出您的在线课程项目,或者过分强调这些经历。

为什么这会成为一个减分项

公司在招聘人员的过程中难免会有一些自我意识。例如在招聘启事上说他们只雇用「非常特殊的人」,或「申请人中排名前 1%」等等。由于现在通过在线课程认证的候选人特别多,因而你很难从中脱颖而出。 如今招聘人员都对许多在线课程非常熟悉,他们可以立即识别出那些属于标准纳米学科或在线课程的项目(例如,Udacity 的交通标志分类任务,这会在你的简历中显得很刺眼)。为了能从众多候选人中脱颖而出,你需要关注那些还没有经过深入研究的问题。

在这里我想明确的是:Udacity、Coursera 和 deeplearning.ai 都是很棒的在线学习平台。它们也可以反映出候选人的可雇佣性和技术能力(根据我们获得的数据显示)。但是把这些放在简历前面,而且几乎没有他项目或经验,很难让那些正在寻找「真正特别的人」的招聘人员对你感兴趣。

如何解决这个问题

一旦你完成你的在线课程或纳米学位,你需要立刻参加 Kaggle 比赛,或者去复现数据科学论文中的结果。

这很重要,因为它:

1)让你看起来更与众不同,2)给你在面试中展示和讨论的前沿工作的机会,3)表明你有进行独立学习和工作的能力。

例外

如果你完成的这个在线课程是独一无二的,那你不需要担心上述问题。我的意思是,您自由选择所需的数据集,从头开始自主解决问题。并在很大程度上靠您自己来解决问题。因为这实际上和你自己完成一个项目没有什么区别,不会成为你简历的减分项。

3. 没有在简历中列出版本控制、开发运维、数据库技能

如果没有注明你会这些技能,那这对从事数据科学会是致命的。

以下是一些必备的技能:

•  版本控制 (GitHub / GitLab) ·

•  开发运维 (AWS / Floydhub / Digital Ocean / Flask)

•  数据库 (mySQL / mongoDB)

为什么这会成为减分项

在数据科学中,人们感兴趣的往往是算法,例如研究解决问题的神经网络或增强树的结构架构。因此这也是大多数人投入时间精力的地方。问题在于,设计模型与可用于生产的深度学习或数据科学不同。数据科学中不太有趣的部分 (设置服务器,清理数据) 实际上构成了数据科学家的日常工作。因此,仅仅掌握 Python / sklearn / TensorFlow / Keras / PyTorch 这些是不够的。对于一个数据科学家而言,不具备这些技能就会被淘汰。

不会 GitHub?不会 mongo?那不用了,谢谢。

如何解决这个问题

如果你具备这些技能但未在简历中列出,请列出。如果你缺乏这些技能,那么建议你立刻去学习,因为这些技能对于数据科学家来说是必不可少的。 例外

如果你申请的更为高级的职位,那么是否列出这些技能并不显得很重要。但是高级的职位意味着你需要更多的经验和其他技能。

4. 没有从你已完成的项目中学到任何东西

如果你的简历中列出了某个项目,那么面试中很可能问到这个项目。 如果面试官问你在这个项目中学到了什么,但你答不出来的话,这会让面试官对你的印象大打折扣。

为什么这会成为减分项

既然你花了时间去研究一个项目,既然你在某个项目上花了时间,那么关于这个项目的问题能够体现你从中学到了什么,还会体现你考虑问题的深度和沟通技巧。即使只是一个相当简单的数据集,你也能从中有些收获。

如何解决这个问题

如果你的简历中列出了某个项目,在面试前你要准备好关于这个项目的见解和看法。

例外

这里没有例外情况,如果你简历中列举了某个项目,你需要对其进行总结反思。

补充:拼写错误

其实这并不是数据科学方面的问题,但在面试过程中,我们惊讶的发现很多人会出现拼写错误这样的问题。总而言之,在简历中出现错别字、拼写错误和格式错误都是致命的。无论你的经验水平如何,拼写错误都是必须避免的问题,这会让你的面试大大减分。

为什么这会成为减分项

这并不值得奇怪,因为你在简历中体现的细节问题与你的项目能力和技术发展息息相关。

如何解决这个问题

注意细节,仔细检查。也可以让英语为母语的人帮你检查简历。向他们保证如果你被录用,他们会向他们支付 50 美元,这只是为了激励他们更多地抓住任何不合适的小细节。

例外

没有例外,这方面不应该有任何借口。

原文链接:https://towardsdatascience.com/the-4-fastest-ways-not-to-get-hired-as-a-data-scientist-565b42bd011e

标签: Mysql 服务器 谷歌 排名 数据库 网络

版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点!
本站所提供的图片等素材,版权归原作者所有,如需使用,请与原作者联系。

上一篇:AI医疗新突破:增强罕见疾病的影像数据集,大幅提高识别准确率

下一篇:从迪士尼到谷歌,他用推荐算法玩儿转数据科学