从零开始学数据分析,什么程度可以找工作,如何计划学习方案?

[复制链接]
查看7951 | 回复0 | 2022-3-7 07:41:08 | 显示全部楼层 |阅读模式
本文作者:京东金融-技术研发部-数据部-运营分析部 机构负责人 李龙
  ~0 l! y( d3 \# W4 r" I4 a! M
目前我在京东金融负责对接金融全业务线的数据分析。结合我个人在学习数据分析和面试的经验,试着回答一下楼主的问题。
! e  m1 u- C7 `9 A一、数据分析学习到什么程度可以找工作?: l5 `' Y# t7 h0 S

) @5 R4 g& V4 h5 a, u( w这个问题要看你准备面试的公司,具体情况差异较大。所以我只能从自身真实经验中总结一些建议,给出一些最基础的知识结构,供楼主参考。9 o& {5 k  w2 s1 Q8 u# T
首先,我觉得优秀的数据分析师应该具备三方面的素质:0 j- }2 h# S9 w* z& j

    % W! w0 U6 z/ n- W1 m% K/ D
  • 数据分析技能;5 N9 ^* d9 `7 ]1 `( r) C/ e
  • 对业务的理解;- {# k. F0 G+ Z, c8 d- C( c1 _
  • 独到的分析思维和表达;
    2 c8 z5 W" g$ }
当然,只要具备基本的数据分析技能就可以尝试找工作了,可以在工作中逐步培养和提升后面两项素质。
  c% K' H% M  w, g6 J+ D楼主的专业是非计算机或统计专业,所以相对来说要多花一些时间补充最基础的技能。楼主现在在学的R语言没有问题,只是我认为可以先把基础打牢,再学R也不迟。因为R语言的应用过程中会涉及一些统计学的概念,如果对统计学有所了解,学习R的效率也会加快。
) T" M( }7 `5 T2 P" G/ K我个人的学习路径是这样的:- b; A. N% Q3 N1 R, R& \+ F
1、统计学0 d1 A6 r/ k1 B
学习最基本的统计学知识。/ {! g, g! R5 @' Y" D
我认为统计是数据分析的基石,统计分析可以解决日常大部分的分析需求,所以强烈推荐楼主先从统计学开始。, g/ T+ }( ]7 U' [* l
了解概率、分布、抽样、线性回归、时间序列。
1 y  m5 V; \/ ^. J推荐书目:《商务与经济统计》。
' y: W& ?. u( n4 I这本书的特点是案例很丰富,讲解通俗易懂,非常适合零基础的读者。$ {# @, s4 H; \8 ~4 j1 G/ s
2、Excel4 ^7 k7 `7 p" E3 s
熟练使用Excel。
4 ]5 {5 T' U6 xExcel的功能非常强大,各类函数非常丰富,尤其是数据透视表的功能一定要用好,你的分析能力会得到迅速提高。" t3 u1 @1 H+ \5 C1 H2 k; j
推荐书目:《谁说菜鸟不会数据分析》。
  z" t4 Q: o/ _0 z这本书不只是介绍Excel的功能,更重要的是介绍一些实践场景中数据分析的步骤和思路,对于初学者有一定指导意义。
) J& c+ @; T  ?3、SQL5 ^& a* Q( v- w5 D/ H# }6 j
有了前两项的技能,你已经可以做一些初级的数据分析工作了。只是,Excel的局限在于数据量的限制。当你要分析的数据超过百万级别的时候,Excel就力不从心了。
+ s' Y9 r: m& P这时候需要数据库来解决,而从数据库中获取数据要依靠SQL语言。
4 ?- ?( ?7 e- z' E- ?' |, C( f可以把MySQL作为学习对象,简单了解一些数据库范式设计等基本的数据库原理,重点学习SQL语言。可以自己安装一个MySQL数据库实践操作练习。8 _7 m& b+ G( G) a: ~0 ?, `
推荐书目:《MySQL必知必会》。
; B9 {6 J' }1 ]& P2 q% m8 y重点学习Select、聚合函数、关联查询等内容,系统管理方面可以忽略。2 e) s  l4 Y" P- y# d0 _
4、Hive
' L: Z# \* I# j; T) Y具备了SQL基础,就可以考虑向大数据方向进军了。
2 D7 O6 a* b5 i# A! e了解Hadoop生态圈,理解HDFS的原理,重点学习Hive。
1 m# C; A2 R! @  G3 AHive就是为了让数据分析师能平稳过渡到大数据领域而诞生的。
/ Y2 a6 o' u- n% i只要你会SQL,就可以通过Hive查询Hadoop中的数据。1 t4 `2 t4 S& _  }- |) [
推荐书目:《Hive编程指南》。
- F+ x' C& _* o4 R重点看HiveQL的数据操作、查询、调优部分,系统开发部分对于数据分析师应用的场景较少,简单了解即可。
) |! m; N5 H, m/ V% Q* b- h5、数据挖掘、机器学习
* a' ~0 R1 O/ a! Y! p: F这部分可以选择性学习。因为统计分析基本可以解决日常数据分析工作的70%-80%的需求,而且数据挖掘和机器学习的难度较大,门槛略高。
* M8 g1 n1 a. ~, U* K8 h5 M这部分主要是了解数据挖掘和机器学习的基本概念和理论。比如:分类、聚类、回归、决策树、贝叶斯定理等。: L- @1 s1 Y+ o
推荐书目:《数据挖掘概念与技术》;《机器学习》。
  v5 D# E7 k/ D: n6 Q同时选择性学习R或Python。0 G% L* P9 E$ v; h
推荐书目:《R语言实践》;《利用Python进行数据分析》。
/ \0 M* x3 q  o+ w语法只是基础,重要的是找一些具体的例子进行实践练习。' R8 ^, _, ~, r
以上就是最最基础的数据分析基本技能了。' t; x1 L& u' o# A
如果从零开始学习,可能需要3-6个月的学习时间。基础较好的话,2-3个月就能基本掌握。; g/ `. m% i0 b0 L7 U) k
当然,要精通还需要大量的实践才能积累更多经验。. u; E& t% Y' `/ g$ C+ T. ~& v
此时,你已经具备了面试数据分析师的基础,但是否面试成功还要找准目标和定位,以及行业知识储备和工作经营等。8 @" T+ f  _1 L. W* v+ q2 X
二、初级的数据分析会做哪些工作?, l% T7 Z# R6 {* K1 z

$ H: N) L0 Y3 j9 D: s$ b- D每一个数据分析师都有这样的理想,通过自己慧眼在数据的沙漠中找出宝贵的金子,或者自己的分析结果被决策层作为依据成功创造了大把利润。1 ?; e0 k% ?9 @9 h0 S
但此时我们离这些目标依然有很长的路。
  s% O! s+ J( J" v" q8 G3 \" E初级的数据分析中最常见的工作有三种:数据提取、报表开发、撰写分析报告。# J$ A  r/ B( d1 R# b" O6 x/ O  X% ?
    / A! E; ~  ~; A, t8 o% F' D
  • 数据提取将会是你的主要工作,也是一切分析的基础。3 e6 t0 l5 k# Q* I& l/ P1 R
不夸张的说,大部分分析项目中80%的精力都在数据获取和加工的阶段。; _. B9 r: \1 J3 B+ @! ^
从数据库中想尽一切办法把数据提取出来,看似并不复杂,但对你的SQL功力是个考验。/ R! {# E# m' P& y0 D5 j0 F
有时候一个over函数可以节省几百行的代码,一段SQL的优化可以提高十倍以上的效率。所以踏踏实实的把数据提取做好,不要认为这个毫无意义。5 M4 l- h4 a# N- o2 H6 _8 O
    " z! y2 O6 V7 k$ N2 ]7 l* {
  • 当你可以高效准确的把数据提取做好之后,就可以着手进行报表开发的学习:将常用的数据提取固化下来,形成表格或可视化的图表。
    & q8 _% t- L* R" R; ~0 A$ L3 d
这时候你会发现之前学习的Excel和数据库设计等知识要发挥作用了。4 o5 a  [9 ?# H- K7 f6 }' {1 g% T
需要进一步学习BI方面的基础知识,了解什么是星型模型、数据仓库、Cube等。推荐一本《数据科学与大数据分析》。
* l, C) J  `7 {Excel也是可视化工具,但只能在单机上查看,所以更多时候会学习一些报表开发工具或可视化分析工具,比如:PowerBI、Tableau等。在网上可以搜到这些工具的视频教学,下载试用版自行练习就行。; X5 \3 x3 p) |. i
    0 S/ D$ s$ f0 N- _
  • 撰写分析报告,就是把众多报表组合成一篇可以让人读懂的PPT。
    5 ~- l( E: `" o8 F$ k* ~7 }
这时候考验的就是你的PPT功力了。一份好的分析报告除了简洁和漂亮的PPT,更重要的抓住主题、清晰的分析思路和有价值的结论。如果你还能够生动的把PPT的内容讲出来,那就更完美了。0 O6 x; J0 s0 \# C/ Z
做好了以上三个方面,恭喜你,你应该已经成为了一名略有小成的数据分析师。
0 f2 D* U* g8 P4 J, d三、数据分析有什么小方向吗?* G6 d: m: H$ Q# P/ u) t3 h  _

! V6 B% a% U% h2 l/ G数据分析的小方向比较多,分类方法也不尽相同。在这里我根据技术要求的侧重点不同,简单的划分为三个方向:, a0 \$ l+ g6 m+ T0 R
1、BI方向$ u- j0 u* x" S! j/ E$ G" ?
BI的概念已经出现很久了,但仍然不过时。
* w; L5 t# m8 x% w9 X1 L重点在于如何设计高效的数据模型,以及如何通过BI工具从多个角度观察数据,了解数据内部的规律。
% x0 y2 s5 }& h: B传统的BI工具可以满足大部分传统企业的数据分析场景。近些年随着分析工具功能日趋强大,大数据领域的BI平台也有了长足的发展。# h# m9 b% z  W" s# v2 M
所以我认为BI仍然具有强大的生命力。1 J/ a( z* H% Q" S" a5 t
2、机器学习方向
9 {, }% Y- X# k8 s) e机器学习与BI的区别在于,更多的依赖机器模拟人类学习的过程去发现数据内在的规律,构建一个数据模型,通过某些算法来预测未来的可能性。+ l; u/ L5 |/ g7 Q  @7 A' N
机器学习和深度学习概念非常火热,但相对入门门槛也较高,因为想真正理解那些算法的原理需要高等数学的基础。
" Q- _1 `0 f8 c2 h4 }& ~: {3、行业分析方向
" J/ M9 l2 d5 h5 ?8 O& V+ ]还有一些数据分析师,仅仅通过一些公开的市场宏观数据,通过经济学和统计学分析方法,观察经济的运行状况,从而发现行业的经济发展规律,进一步预测未来行业发展的趋势。这个方向也很不错的,但是需要对统计和经济学有一定基础。# t' f1 P% P8 D. B' `+ E
四、想要深度做数据分析有怎样的建议, D$ |+ b* K9 x0 |9 ?8 w+ s
- V9 X* W! O8 C
楼主想深度做数据分析领域,首先要认准自身的优势,参考上面列出的几个发展方向,选择其一进行深入的学习和实践。
4 S5 j- f3 s  `5 ]9 I, V如果楼主的计算机基础比较好,擅长SQL和BI工具,可以向着BI方向发展;, P4 d  f9 F( _1 S" j2 m
如果数学基础比较好,可以考虑机器学习方向;! i! m" V( R3 B0 S# D5 V
如果对所在行业的业务比较精通,也可以从事业务分析或行业分析方向。7 [$ |. W) M# f. _1 ~9 i
做适合的和喜欢的最重要。不论哪个方向,都是要先掌握工具使用,了解你要分析的业务流程,培养独到的分析思维模式,锻炼自己的表达。" A/ {; @* }1 x. l! u  K* k- a
五、统计的学习应该从哪里下手
0 a* C8 a6 ^. b; B% D* ~' `1 N" V# r! s5 H0 \$ g7 j) C8 X
就我本人来说,基本就是看前面推荐过的那本《商务与经济统计》,并且在实际工作中要有意识的应用。3 `/ X4 F1 y6 x
比如,观察一批数据的时候,就可以用R先了解数据的均值,方差,中位数,极大值,极小值等等,通过绘制直方图来了解的数据分布情况、缺失情况等等。: t, c# ]' m% W  B( h. G, ?( [) M# ?
通过预测的场景,首先可以用线性回归来尝试,效果不一定比机器学习的算法差。2 B$ I4 J% k- w$ G$ D

8 ~6 f: ^/ v$ A+ m以上就是我针对楼主的几个问题做出的个人建议,供参考。- |) j/ `) `. h6 p
<hr/>相关回答:( F$ {0 D8 M& y& O! a- G
数据分析入门及职业规划?
9 R0 ]$ f$ n% X7 ?$ x) d在数据分析、挖掘方面,有哪些好书值得推荐?; L, s4 R0 h3 h
怎么培养数据分析的能力?
  x- H: Y) F8 r) k' ~$ j+ \8 m<hr/>我们与张登峰老师合作举办的live《数据分析师面试求职全攻略》,欢迎大家关注↓↓
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

226

金钱

0

收听

0

听众
性别

新手上路

金钱
226 元