2018 数据分析师成长指南

5,162 阅读12分钟


文/ 曾加 蚂蚁金服数据分析师

导语:从零开始学数据分析,什么程度可以找工作?蚂蚁金服数据分析专家从三个关键问题出发,帮你系统梳理应该如何进入数据分析行业。

     很多人建议新手去点亮很多技能树,什么 Excel/统计学/SQL/R/Python/Hadoop/机器学习/可视化 等等,对此我并不是非常认同,原因很简单:如果目的在于「找工作」,核心在于「快速入行」,而不在于「系统学习」,因此一开始学习这么多领域的知识是不太合适的。


接下来,要「逆向思考」,分步解答这个问题。


问题一

我想进什么样的公司?
在我心目中,数据分析师的日常工作状态应该是怎样的?

     这个问题非常重要,甚至比学什么更重要,因为同样 title 为「数据分析师」的职位,工作内容可能大相径庭:有的类似于「商业咨询师」,有的类似于「数据仓库工程师」,有的类似于「机器学习工程师」,也有的类似于「数据口径核对师」等等。


     这些同样名为「数据分析师」的岗位,不仅工作内容完全不同,需要的技能树也完全不一样。如果不弄清它们各自所需的技能树,就去「盲人摸象」般地学习各类知识,到头来找工作时看到岗位需求的时候,很可能会傻眼。


举个例子:在一些大型的互联网公司(如阿里、腾讯等)里,有一个岗位叫「商业数据分析师」,听起来挺高大上的,不过如果我告诉你,做这个岗位的很多人不需要懂统计学,不需要懂 Python,更不需要懂什么机器学习,只需要会 SQL 并且有「业务sense」就可以了,你是不是会感到惊讶和疑惑呢?但事实就是如此。


必须要说的是,不是所有的「数据分析师」都需要用到高大上的工具,因为大部分数据分析师的核心目标是「解决问题」(而解决问题所用的方法则未必重要),而解决问题的核心往往是「懂业务」,这是很多公司在招聘时强调「业务sense」的重要原因。如果觉得会很多技能就很厉害,那是典型的「学生思维」。


 P.S. 也许你又有一个疑问,对于刚入行的人来说,所谓的「业务sense」如何判断呢?或者说,面试的时候,面试官如何判断一个初级的应聘者是否有业务sense?通过我的观察,对国内互联网大公司而言,主要是四个方向:

  1. 学校和专业背景(偏数理的理工科或经济类为佳)是否有竞争力;
  2. 是否有相关的实习经历;
  3. 描述自己经历时和回答问题时的逻辑性和框架性;
  4. 对当前互联网时事新闻的见解是否有趣而独到。


问题二

假如我现在已经有心仪的公司了,我该如何判断这个公司的工作内容,
更进一步地,判断自己需要掌握哪些技能?

一个简单的方法是直接去应聘网站看JD(岗位描述),但这个方法并不是特别通用。在我看来,不妨从 公司类型、公司规模、公司业务、公司阶段、公司风格 这五个维度来判断「数据分析」岗位所需要的技能。如下图所示:



1. 公司类型

在不同类型的公司里,数据分析师的工作是完全不同的:

  • 对于传统公司而言,数据分析师更接近于「业务分析师」,他们不需要处理太多的原始数据,更多地需要将已有的数据整合和分析,从而支持业务发展,对于这类公司来说,统计学是重要的,而 Excel/R/Tableau 等处理数据的工具也是有必要学习的。
  • 但对于很多互联网公司而言,数据分析师可能需要处理更多原始数据,所以SQL/Python/Java 等数据清洗的工具显得更重要一些。

2. 公司规模

小公司和大公司的「数据分析师」做的事情「广度」有明显差别。


对于大公司而言,业务分工比较明确「数据分析师」是一系列不同的岗位:


  1. 离原始数据最近、离业务最远是 数据仓库工程师(它有很多别名,如:数据工程师/数据融合工程师/ETL工程师等等),他们的工作主要是把技术从用户和商户这里提取的行为数据进行清洗和预处理,使其结构化,是更接近于技术的岗位,相对来说,工作会比较单纯一些。
  2. 距离原始数据较远、离业务较近的是 商业数据分析师(又称:Business Intelligence,BI),他们的工作是提取正确的业务数据,并制作报表和具有洞见的分析。这类岗位可能需要处理很多繁杂的数据口径、需要会 SQL,根据公司的报表体系需要会 Tableau/Excel,但更重要的是能给业务方有效的输入。也正因为这个岗位链接了数据和业务,所以需要非常强的「协同能力」。
  3. 距离原始数据和业务都不近不远的数据岗位主要是 数据挖掘工程师 (也有一些分支,如:算法工程师、机器学习工程师等等),这些岗位往往不需要接触最原始的数据,也不会在业务的最前线,但通常需要给业务提供一些间接的能力,比如判断能力(如:两个用户的关系是否为同学)、预测能力(如:预测会产生业务风险用户)、识别能力(如:判断一张图片是否为猫)等等。这类工作本身比较独立,很有创造性,但要求也比较高。



但对于小而精的公司而言,「数据分析师」的岗位分工可能就不那么明确了。因为人手有限,公司不能为每一个工作职能制定对应的岗位,所以希望能招一个「全栈数据分析师」(更酷的说法是:「数据科学家」)。从数据提取到展现结果的每一个环节,「全栈数据分析师」都需要十分清楚,所以综合能力比较强的员工才能胜任。


3. 公司业务

公司业务对「数据分析师」岗位的工作内容有不小的影响:

• 在垂直的或者说业务比较集中的公司中,数据的来源以及类型相对比较少,我们在数据预处理上不需要太多的精力,更注重数据的使用和多维度展现,挖掘有价值的信息,这个岗位是比较有探索性的,更接近于「数据挖掘工程师」。

• 但在业务繁杂的公司里,「数据分析师」的地位比较微妙。业务繁杂意味着变动比较快,这使得一般意义上的「数据分析师」往往无法长时间地做相同的业务(一直对接同一业务的分析师我们一般叫做「行业运营」(不要觉得运营岗位不够高大上,事实上优秀的运营也很擅长数据分析,对公司的价值很大),所以快速产出数据的能力就变得尤为重要了。此外,在这种情况下,我们需要优质的数据体系,更进一步地,需要「数据产品」。像 Tableau 就是非常优秀的数据产品,很多大型的公司也会去设计自己的数据产品,以满足业务的需要。有了做数据产品的需求,我们就多了两类新的职位,一个叫「数据开发工程师」,一个叫「数据产品设计师」。


4. 公司阶段

公司所处的阶段会影响「数据分析」工作的方向:

  • 对于初创公司来说,整个数据体系尚未建立,关于数据通常是要啥没啥,在这个时候,你就别指望能使用模型去做什么高大上的分析了。配合技术去找到正确的数据才是你的首要任务。这个工作看起来枯燥,但却异常重要,如果你能做好,很快就会有机会成为公司最不可或缺的员工之一——毕竟,对于公司所有的数据,你是唯一的出口。
  • 而对于成熟公司来说,底层数据体系已经搭建得很完善了,对于初级员工来说,你根本不需要修改啥。想要的数据,基本只要有耐心,都能搞得到,但在口径的寻找上,可能会非常费时费力,清洗数据需要花费你很长的时间。不过,汇总完一大批数据,不就可以上高大上模型了吗?算法、机器学习什么的,都可以用上,你可以尽情地在数据的海洋中遨游。


5. 公司风格

最后说说公司风格。和数据分析师相关的公司风格有两类,一类是「数据驱动」,一类是「业务驱动」。


对于「数据驱动」的公司来说,我们会先看足够多的数据,再从数据中找到有意思的点,然后进行分析来决定未来要做什么业务;对于「业务驱动」的公司来说,我们先决定要做什么业务,然后再决定要什么数据。


这种风格上的差别会使得数据分析师的地位产生巨大差别。在「数据驱动」的公司里,数据分析师的地位很高,因为公司的 KPI 是由你来决定的。而在「业务驱动」的公司里,呵呵,如果没有优秀的领导者带领,数据分析师一不留神就会沦为「取数机器」。


一个不太好的消息是,如今在国内,数据驱动的公司少之又少,尤其在一些大公司里,虽然它们自称是「数据驱动」的,但事实上,数据分析师常常被业务牵着鼻子走,位于附属的地位。所以,在真正工作之前,如果有机会的话,还是建议先实习,避免遇到坑。


好了,看完了上面内容,你大概就会知道自己究竟想做什么类型的数据分析师,在学习时也就可以有的放矢了。


问题三

如果我真的是零基础,该如何入门呢?

回到开头的回答,很多答主推荐了一堆书,什么《深入浅出数据分析》《深入浅出SQL》等等,这些书当然不错,不过据我观察,看书自学比较适合有天赋的人,大部分人很难有的放矢地只通过看书学好,对于真正的小白来说,通过在线学习平台是从零学习快速入行的首选方法。预估大约花 300 小时,就可以有不错的基础了。



至于平台选择,虽然国内教育平台正在蓬勃发展,但我还是更倾向于海外平台,因为它们起步更早,发展得也更充分一些。


Coursera 是众所周知的,数据分析的课程也挺多,适合各种不同需求的人,开课的讲师大多为北美名校教授,课程对知识的讲解会比较到位,但大部分课程是全英文的,对很多英语基础不太好的小白来说有点小障碍;


优达学城(Udacity) 同为三大在线平台,课程的质量也很高,讲师大都来自硅谷互联网巨头,比如 Facebook 和 Google,课程有完整汉化。学完后在找工作方面比学院派的 Coursera 更有针对性,而实战项目和其提供的中文助教和导师服务也能协助学习,以数据分析课程为例,入门就可以从零掌握 Python/SQL/统计学基础。


进阶课程则进一步涉及到 R/Tableau 等,总共花 300 小时左右认真学完和吸收以后,数据分析的基础可以打得非常扎实。而对于上文提到的大互联网企业中的「商业数据分析师」,也有无需学习任何编程的对应课程,满足这样的岗位需求。



立即加入7天试学: Udacity 【数据分析师】纳米学位

13周入门数据分析,学会用 Tableau、Python 和 R 创造最佳的数据解读


打好基础,再针对自己想要去的公司和岗位学一些进阶课程。那么,只要学历背景不算太差,那么凭自己精心打造的「技能树」成长路线,到大部分公司胜任绝大多数数据分析师初级岗位应该是没有问题的。


当然,无论是学习什么课程,完整地学一遍下来都不是一件轻松的事。但毕竟是职业选择,慎重一些、认真一些,多花一些精力甚至是金钱,也绝对是值得的。


硅谷大学让你在业余时间掌握新技能

Udacity 优达学城的创始人是 Google 无人车之父 Sebastian Thrun,与 Google、Facebook、亚马逊等全球领先企业联合打造了一系列前沿技术课程,并提供人工项目审阅、一对一在线答疑等学习服务,旨在让每个人都能用远低于线下教育的成本硅谷最新最热技术教育,帮助学员成为能驱动企业创新变革的抢手人才。