从零开始学数据分析,什么程度可以找工作,如何计划学习方案?

[复制链接]
查看7950 | 回复0 | 2022-3-7 07:41:08 | 显示全部楼层 |阅读模式
本文作者:京东金融-技术研发部-数据部-运营分析部 机构负责人 李龙

; F; [5 H2 H  ]1 d- q* H7 Y目前我在京东金融负责对接金融全业务线的数据分析。结合我个人在学习数据分析和面试的经验,试着回答一下楼主的问题。. k& L6 l8 O- [+ q
一、数据分析学习到什么程度可以找工作?
. |, R  {; d/ ^6 M4 @* `8 C; z6 x% z* `. E3 F+ Y
这个问题要看你准备面试的公司,具体情况差异较大。所以我只能从自身真实经验中总结一些建议,给出一些最基础的知识结构,供楼主参考。, d# ^. V8 C& p$ L1 i9 O
首先,我觉得优秀的数据分析师应该具备三方面的素质:  R0 p" S" {3 X4 m# M9 {4 f& C
    ' F1 e$ E" B& |' @
  • 数据分析技能;
    + \; k7 w1 R* M# R, c9 l1 Z
  • 对业务的理解;
    2 S8 ~! y! J" g8 r
  • 独到的分析思维和表达;" p2 ?3 e" ?+ H& I0 C: I
当然,只要具备基本的数据分析技能就可以尝试找工作了,可以在工作中逐步培养和提升后面两项素质。
5 E2 A) ?; A3 G& s+ o5 M, x$ @楼主的专业是非计算机或统计专业,所以相对来说要多花一些时间补充最基础的技能。楼主现在在学的R语言没有问题,只是我认为可以先把基础打牢,再学R也不迟。因为R语言的应用过程中会涉及一些统计学的概念,如果对统计学有所了解,学习R的效率也会加快。- i7 B; e+ v" ?4 E2 ^$ i3 M
我个人的学习路径是这样的:" m/ c( N$ a. x9 ~
1、统计学8 {' R. B9 ^4 v  D* m/ M( t, L" v9 D
学习最基本的统计学知识。
# A. E9 X* ~  S  M/ k' u  l1 h9 u我认为统计是数据分析的基石,统计分析可以解决日常大部分的分析需求,所以强烈推荐楼主先从统计学开始。
( U. v* V: ~5 Y/ z5 E了解概率、分布、抽样、线性回归、时间序列。. X$ O. l/ A( Y6 c8 G" q
推荐书目:《商务与经济统计》。
* E% W5 X5 L1 h& h这本书的特点是案例很丰富,讲解通俗易懂,非常适合零基础的读者。( k$ `) E/ H( I" n4 t; b' F& w; H
2、Excel
1 i% R* Y/ o% t5 q+ z熟练使用Excel。
* z1 p0 F# y7 B. C) [Excel的功能非常强大,各类函数非常丰富,尤其是数据透视表的功能一定要用好,你的分析能力会得到迅速提高。
2 U/ T0 ^, M0 {' f. q/ f推荐书目:《谁说菜鸟不会数据分析》。0 l/ @1 K+ W5 j9 `# w9 F
这本书不只是介绍Excel的功能,更重要的是介绍一些实践场景中数据分析的步骤和思路,对于初学者有一定指导意义。  v: [2 s/ d. @, e* i( e+ \
3、SQL8 R$ v) T9 Z1 t
有了前两项的技能,你已经可以做一些初级的数据分析工作了。只是,Excel的局限在于数据量的限制。当你要分析的数据超过百万级别的时候,Excel就力不从心了。; P8 |! A- N. H
这时候需要数据库来解决,而从数据库中获取数据要依靠SQL语言。
# J3 T5 b9 T6 x7 j3 m5 Z3 z可以把MySQL作为学习对象,简单了解一些数据库范式设计等基本的数据库原理,重点学习SQL语言。可以自己安装一个MySQL数据库实践操作练习。* {0 u& p% q7 t: {: q$ m: |
推荐书目:《MySQL必知必会》。+ R; G3 b" T) D" L$ X
重点学习Select、聚合函数、关联查询等内容,系统管理方面可以忽略。
% C" |' h- s0 Z# r1 T4、Hive
* d3 z1 B  l1 M$ M% W3 Y# M具备了SQL基础,就可以考虑向大数据方向进军了。  v3 D2 E6 Z7 O
了解Hadoop生态圈,理解HDFS的原理,重点学习Hive。
( H. u! U6 x6 K2 pHive就是为了让数据分析师能平稳过渡到大数据领域而诞生的。; b  L' H/ T3 ?0 k$ f
只要你会SQL,就可以通过Hive查询Hadoop中的数据。3 _4 h6 }* O  ]# ^1 L! a' G% i
推荐书目:《Hive编程指南》。
. g# |  H7 {% f重点看HiveQL的数据操作、查询、调优部分,系统开发部分对于数据分析师应用的场景较少,简单了解即可。
9 a# G. M- S3 M5、数据挖掘、机器学习4 C  I/ O; R2 P" \# R
这部分可以选择性学习。因为统计分析基本可以解决日常数据分析工作的70%-80%的需求,而且数据挖掘和机器学习的难度较大,门槛略高。
% |: V- y# S0 Y6 e8 g! H9 p, B这部分主要是了解数据挖掘和机器学习的基本概念和理论。比如:分类、聚类、回归、决策树、贝叶斯定理等。2 q% ^' f% @1 g" s
推荐书目:《数据挖掘概念与技术》;《机器学习》。
8 p: y  m! f  w4 W" d  d0 X同时选择性学习R或Python。
' |* P# f/ M* v0 ~& ^1 s  s8 ]/ Z2 t推荐书目:《R语言实践》;《利用Python进行数据分析》。  E$ F; D2 u3 O5 w
语法只是基础,重要的是找一些具体的例子进行实践练习。. g' H4 t. f( V$ Y" ^
以上就是最最基础的数据分析基本技能了。
3 Y3 t! `& P% X$ w" d( o7 y如果从零开始学习,可能需要3-6个月的学习时间。基础较好的话,2-3个月就能基本掌握。* p  j) q* ~$ G: X* b! l" S4 e
当然,要精通还需要大量的实践才能积累更多经验。% k" c- m3 j' |; w7 Y
此时,你已经具备了面试数据分析师的基础,但是否面试成功还要找准目标和定位,以及行业知识储备和工作经营等。
2 V' T. w) E- N2 X7 W) ]3 P- n: r二、初级的数据分析会做哪些工作?
. Z1 c6 {$ r/ J$ I1 q
" t- o5 F0 F" c( A# O) N- t每一个数据分析师都有这样的理想,通过自己慧眼在数据的沙漠中找出宝贵的金子,或者自己的分析结果被决策层作为依据成功创造了大把利润。! x- U* J% d1 \2 l- `7 H" u
但此时我们离这些目标依然有很长的路。
  k$ }1 b0 R8 s; \8 o! w! X初级的数据分析中最常见的工作有三种:数据提取、报表开发、撰写分析报告。
- }) ?0 |3 K! W8 h# |" @

    ) \- Q8 @3 n4 e) k
  • 数据提取将会是你的主要工作,也是一切分析的基础。7 N" v* v. y9 h, I$ D  d8 C
不夸张的说,大部分分析项目中80%的精力都在数据获取和加工的阶段。
/ |5 ]' s- y  q0 @' J从数据库中想尽一切办法把数据提取出来,看似并不复杂,但对你的SQL功力是个考验。# r' z- y/ [/ Z. }1 u, Q6 `* M
有时候一个over函数可以节省几百行的代码,一段SQL的优化可以提高十倍以上的效率。所以踏踏实实的把数据提取做好,不要认为这个毫无意义。/ ~# S+ K( f) J9 [9 x8 }
    * Y- _$ j2 Z2 V+ h5 ~: l; i  O
  • 当你可以高效准确的把数据提取做好之后,就可以着手进行报表开发的学习:将常用的数据提取固化下来,形成表格或可视化的图表。( @# G( {! [) g) w6 r% R' Q' f
这时候你会发现之前学习的Excel和数据库设计等知识要发挥作用了。
% \( d# a4 U! Y3 ^需要进一步学习BI方面的基础知识,了解什么是星型模型、数据仓库、Cube等。推荐一本《数据科学与大数据分析》。
9 d* G, @* @; q5 s2 j: q8 TExcel也是可视化工具,但只能在单机上查看,所以更多时候会学习一些报表开发工具或可视化分析工具,比如:PowerBI、Tableau等。在网上可以搜到这些工具的视频教学,下载试用版自行练习就行。, H9 G& i9 ~7 E

    1 ~* D  J  u( l* B( I" p7 V8 b  d% L
  • 撰写分析报告,就是把众多报表组合成一篇可以让人读懂的PPT。) m1 f, E* P6 b$ D+ z* L, H
这时候考验的就是你的PPT功力了。一份好的分析报告除了简洁和漂亮的PPT,更重要的抓住主题、清晰的分析思路和有价值的结论。如果你还能够生动的把PPT的内容讲出来,那就更完美了。3 L+ }0 n- h( H& i
做好了以上三个方面,恭喜你,你应该已经成为了一名略有小成的数据分析师。1 C* p; }( e6 |# R
三、数据分析有什么小方向吗?" P* c( ?) M% o9 |' F6 T; r* z" {

3 S  G/ Q" s- ~4 I数据分析的小方向比较多,分类方法也不尽相同。在这里我根据技术要求的侧重点不同,简单的划分为三个方向:
7 a1 z' }+ P! j1、BI方向
. r0 }$ b  U3 C0 g- g& ^1 g4 SBI的概念已经出现很久了,但仍然不过时。
& C, x  C( e8 C2 B/ p) A, k重点在于如何设计高效的数据模型,以及如何通过BI工具从多个角度观察数据,了解数据内部的规律。
  N" j: R& w  r( j* h传统的BI工具可以满足大部分传统企业的数据分析场景。近些年随着分析工具功能日趋强大,大数据领域的BI平台也有了长足的发展。# i, o& D" U, B6 p) K& E
所以我认为BI仍然具有强大的生命力。
, A+ j8 n2 X$ [) ~& x( U2、机器学习方向  p; N1 y& U; A/ u7 V. G7 I1 q
机器学习与BI的区别在于,更多的依赖机器模拟人类学习的过程去发现数据内在的规律,构建一个数据模型,通过某些算法来预测未来的可能性。
7 L& X7 m* q5 t9 K! @机器学习和深度学习概念非常火热,但相对入门门槛也较高,因为想真正理解那些算法的原理需要高等数学的基础。: u; O9 G0 b+ i
3、行业分析方向) C% r  W: k- |
还有一些数据分析师,仅仅通过一些公开的市场宏观数据,通过经济学和统计学分析方法,观察经济的运行状况,从而发现行业的经济发展规律,进一步预测未来行业发展的趋势。这个方向也很不错的,但是需要对统计和经济学有一定基础。
7 V+ K7 h7 L0 I( A* a四、想要深度做数据分析有怎样的建议5 ~1 N$ p* Z% l5 k

7 A7 Z: v- S2 n8 b2 a3 P- O楼主想深度做数据分析领域,首先要认准自身的优势,参考上面列出的几个发展方向,选择其一进行深入的学习和实践。
+ g  ?7 R7 D& s! y如果楼主的计算机基础比较好,擅长SQL和BI工具,可以向着BI方向发展;3 e8 K7 T8 h/ P, r& x- C
如果数学基础比较好,可以考虑机器学习方向;5 w, V$ W- [8 D( B) o% x
如果对所在行业的业务比较精通,也可以从事业务分析或行业分析方向。3 `5 Z2 {/ U* D) Y! @
做适合的和喜欢的最重要。不论哪个方向,都是要先掌握工具使用,了解你要分析的业务流程,培养独到的分析思维模式,锻炼自己的表达。, k/ e: ^3 i9 v+ J
五、统计的学习应该从哪里下手
, ?) Q' R  o! h2 E
1 i5 }9 @% b; S# ^# n5 q: D就我本人来说,基本就是看前面推荐过的那本《商务与经济统计》,并且在实际工作中要有意识的应用。% V) a8 o  m# E7 y5 O% {. K
比如,观察一批数据的时候,就可以用R先了解数据的均值,方差,中位数,极大值,极小值等等,通过绘制直方图来了解的数据分布情况、缺失情况等等。! J0 t' Y4 u- ~; h9 L0 d
通过预测的场景,首先可以用线性回归来尝试,效果不一定比机器学习的算法差。
0 F7 H) O# |& w& B9 p1 d& u' A5 Z) v
3 f; y, b$ y( B- Q  v5 J" f8 I以上就是我针对楼主的几个问题做出的个人建议,供参考。" G1 W: O: l; q# [3 ~. M; `
<hr/>相关回答:% E$ x3 |9 \0 K
数据分析入门及职业规划?
+ W. J- z% ]  \; H+ [9 J在数据分析、挖掘方面,有哪些好书值得推荐?9 O) M/ B- ]: a/ D
怎么培养数据分析的能力?# E" ]( ~# c3 O" k
<hr/>我们与张登峰老师合作举办的live《数据分析师面试求职全攻略》,欢迎大家关注↓↓
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

226

金钱

0

收听

0

听众
性别

新手上路

金钱
226 元