数据科学家面试如何准备?

数据科学家面试如何准备?


撰文 | April & Emma

编辑 | Ivy Xu

专栏 | 九章算法


数据科学家(Data Scientist)被《财富》杂志誉为21世纪最性感的职业。据调查显示,仅仅在美国市场,2018年大数据和高级分析相关人才的缺口就将高达19万然而虽然现在很多人对这份职业跃跃欲试,但是却对这份新兴职业并不了解,更不知道应该如何准备面试。


下面我们就来简单介绍一下什么是数据科学家,以及我们应该如何准备数据科学家面试,希望能对想要从事这一职位的朋友有所帮助。


数据科学家面试如何准备?

什么是数据科学家


数据科学家面试如何准备?


“数据科学家”在2009年由Natahn Yau首次提出,简单来说数据科学家就是指能采用科学方法、运用数据挖掘工具对复杂多量的数字、符号、文字、网址、音频或视频等信息进行数字化重现与认识,并能寻找新的数据洞察的工程师或专家(不同于统计学家或分析师)。

一个优秀的数据科学家需要具备的素质有:

懂数据采集、懂数学算法、懂数学软件、懂数据分析、懂预测分析、懂市场应用等。


在初步了解了数据科学家这一概念后,我们来重点研究一下应该如何准备数据科学家面试。




数据科学家面试如何准备?

如何准备数据科学家面试


1.了解你申请的岗位所需的技能


数据科学家面试如何准备?


数据科学家这个职业的定义很广泛。在不同行业不同公司,即使岗位名称同样叫做数据科学家,他们的工作内容也可能是不一样的。这也就是说这个职业有很多分类。


比如:

如果这个职位对你的编程能力要求很高,那么,建议你看一看与软件工作师有关的面试题。


如果这个职位要求你有很高的统计技术,并且需要你了解不同的人口分布、懂得如何设计实验、熟悉如何设置A / B测试和假设测试等,你就要对这些内容进行学习和练习。


所以在面试前,你一定要明确你申请的岗位所要求的技能和职责,因为这决定着你面试时会遇到什么样的题目。


2.向招聘人员询问面试流程


向招聘人员询问面试流程,了解准备面试时可以使用哪些资源以及面试时的着装要求。


可以的话,询问一下面试官的姓名,这样你就可以在网上查找他们的相关资料,从而了解他们的专业领域等信息,并就此作准备,会起到事半功倍的效果。


3.在网上查找以往的面试题


你可以在网上查找你将要面试的公司数据科学家这一岗位的相关面试题,包括行为问题和技术问题。


就算你找不到你将要面试的公司的面试题,你也可以看看其他公司的面试题,让心中对面试问题的类型有个大体了解。


4.提前准备好行为问题的答案


在面试前你要提前准备好你可能遇到的行为问题以及这些问题的答案。

比如说你可能遇到这些问题:

你对要工作的内容感兴趣吗?

你会如何对待团队工作?

你愿意做一些烦人的工作吗?比如清理杂乱的数据。

在这个行业,每个公司都想努力解决的问题是什么?你和你的团队将如何发挥作用?


想要回答好这些问题,你可以查找相关资料并结合自身经验在面试前准备好这些问题的答案,这样当你面试过程中遇到这些问题时,你就能逻辑很清晰的表达出来。


5.仔细阅读招聘要求


查看你那份工作的招聘要求,从中挖掘出你的优势和兴趣。并在面试官根据这些要求提问时说出你的兴趣和优势。这样不仅能体现出你对这份岗位的精准了解,而且能表现出的你的专业能力,从而让你在面试中脱颖而出。

比如:

招聘要求:精通X语言。

面试时:可突出——我本身会Python,所以我学公司要求的X语言是很快的。


招聘要求:会用不同的NLP模块分析文本。

面试时:可突出——我很擅长用不同的NLP模块分析文本,并加以举例。


招聘要求:熟练掌握web-scraping和web-pages-inspecting

面试时:可突出——我会用web scrap和查找web页面写一个爬虫,并举例。


招聘要求:能在SQL和NoSQL数据库找数据。

面试时:可突出——我很擅长在SQL和NoSQL数据库找数据并基于这些数据分析模块。


6.熟悉你的项目经历


数据科学家面试如何准备?


每轮面试前,重温一下自己的简历。因为,大多数面试官会根据你简历上所写的项目进行提问。所以,做一个perfect的总结至关重要。

准备工作:

翻看你的项目资料,回顾一下技术细节。

准备一下你在设计项目时使用数据科学的过程,里面需要包括:你为什么选择这个方法、你对项目的个人贡献、你遇到的挑战、你在这个过程中学到的东西。

多加练习,确保你的总结是连贯的。



7.编程(通常要求在白板上写)


如果你的工作职位需要考察编程能力的话,那么你需要开始以下的准备工作:


掌握基本的算法以及数据结构和算法复杂度。

练习在白板或记事本上编码,熟悉这种感觉。

练习的时候给自己定时,以免面试时因有时间限制而过度紧张。

如果没有太多软件工程经验,可以找精通的朋友帮忙。


面试时:

确保你完全理解题目意思,不清楚的地方要提前问面试官。样式

写代码前,先将方法告诉面试官,让他们可以对你的设计提出优化建议,从而节省时间。

除非面试官提出,不要写到一半去检查无效输出。一般情况下,面试官不会在意这个。

写完代码后,注意检查一下变量初始化、结束条件和边界情况。



8.了解和应用机器学习理论


有的数据科学家职位对机器学习知识有一定的要求。


机器学习理论将测试你对基本机器学习概念的理解,一般侧重于监督式学习。

对于机器学习理论,你应该了解:

监督式学习系统的一般设置

为什么要将数据分为测试集和训练集

如果根据样本数据不能找到普遍规律,那么该怎么办?(参考答案:用不同的样本数据或者投射到更高的维度空间)

如果样本数据太多太杂该怎么办?(参考答案:对其进行正规化)


此外,面试官也可能考察你的应用机器学习的能力。通常,面试官会让你想一个算法实现一个预测类的题。

比如:怎么找出可以推荐给用户的书?
回答此类问题,要明确:

对象是什么?

可以用的机器学习算法有哪些?

内容列表样式


根据问题的定义,对不同的可能情况扩展更多的解决方案,问题就迎刃而解了。

对你的声誉和职业生涯产生影响。


九章算法 | IT 高阶精英求职教育平台


《九章算法班》

《系统设计班》

《Big Data 项目实战班》

《算法面试高频题班》

《Java入门与基础算法班》


正在报名中!

报名登陆官网 www.jiuzhang.com

或点击文末“阅读原文”


数据科学家面试如何准备?