Benzy
2020-10-24T23:29:18+00:00
版面中每周都会有人问,数据分析师需要什么技能?应该如何入行?
每次看到大家分享的,都是知道互联网数据分析师钱多、事多,但具体的需求以及如何入行,都是脑补居多...想基于我个人在过去几年的面试与被面试经验,和大家聊聊阿里P8以前各个等级中,数据分析师/数据科学家的要求,可以根据自己公司的职级往里面套
P8及以后的级别离我还远,就不献丑了
太长不看:
目前的互联网数据分析师,专业能力和通用能力的要求55开,越往上走越需要通用能力
SQL是敲门砖,Excel和PPT是基本技能,行业经验是核心竞争力,表达能力、逻辑思维这些通用能力可以让你走的更远
每次看到大家分享的,都是知道互联网数据分析师钱多、事多,但具体的需求以及如何入行,都是脑补居多...想基于我个人在过去几年的面试与被面试经验,和大家聊聊阿里P8以前各个等级中,数据分析师/数据科学家的要求,可以根据自己公司的职级往里面套
P8及以后的级别离我还远,就不献丑了
个人背景和免责声明 ...
个人背景:北京某互联网大厂,工作六年,数据分析相关四年经验,对标阿里P6+,月入接近2狗
免责声明:这份说明更多的是基于我个人,在过去4年中几十份的面试/被面试经验,北京一线的互联网公司在数据分析师的需求上大致相同,在此只描述通用性需求,不涉及部分公司的特殊要求
岗位描述基于数据分析师,不涉及数仓工程师、数据产品经理
免责声明:这份说明更多的是基于我个人,在过去4年中几十份的面试/被面试经验,北京一线的互联网公司在数据分析师的需求上大致相同,在此只描述通用性需求,不涉及部分公司的特殊要求
岗位描述基于数据分析师,不涉及数仓工程师、数据产品经理
太长不看:
目前的互联网数据分析师,专业能力和通用能力的要求55开,越往上走越需要通用能力
SQL是敲门砖,Excel和PPT是基本技能,行业经验是核心竞争力,表达能力、逻辑思维这些通用能力可以让你走的更远
实习生 ...
对于实习生的要求一般不多,每周4天以上的到岗,6个月以上的实习期就好
专业能力:
1. Excel基础
会用数据透视表、Vlookup、VBA是加分项
2. SQL
会写(抄)基本的代码、对自己的代码可以基于错误提示debug的能力、了解窗口函数
通用能力:
1. 表达清楚流利,性格开朗,工作态度认真
专业能力:
1. Excel基础
会用数据透视表、Vlookup、VBA是加分项
2. SQL
会写(抄)基本的代码、对自己的代码可以基于错误提示debug的能力、了解窗口函数
通用能力:
1. 表达清楚流利,性格开朗,工作态度认真
P5 - 应届生 ...
作为应届生,在学校里学到的东西不是最重要的,参与的社团也不是,更多是看你学校的背景、以及面试表现
你的期望薪资应该是10-15k/月,加上1-2个月的年终
专业能力:
1.SQL
SQL - 必须
对于初级岗位来说,SQL是必须的,你的本职工作中一大部分就是提数、做报表、配置看板
2.数据分析能力
了解基本的数据分析思路,标杆对比、趋势分析,指标的下钻拆解
标杆对比 - 我和目标比,和竞争对手比,数据表现如何?
趋势分析 - 和上周/上个月/去年比,数据表现如何?
下钻拆解 A = A1+A2+A3, A1 = B1 x C1
3.数据可视化
Excel - 必须
会做Excel制作图表,用报表工具配置可视化报表
通用能力:
1.学习能力
能够快速积累经验、学习专业技能和做事方法,把自己学习的心得进行沉淀、文档化,在他人的指导能够下完成一件一件的事情并对结果负责
2.沟通和表达能力
能够表达清楚自己的想法和期望,做事情时遇到的困难,需要的支持,对于事情的看法、观点
推荐“金字塔原理”
你的期望薪资应该是10-15k/月,加上1-2个月的年终
专业能力:
1.SQL
SQL - 必须
对于初级岗位来说,SQL是必须的,你的本职工作中一大部分就是提数、做报表、配置看板
2.数据分析能力
了解基本的数据分析思路,标杆对比、趋势分析,指标的下钻拆解
标杆对比 - 我和目标比,和竞争对手比,数据表现如何?
趋势分析 - 和上周/上个月/去年比,数据表现如何?
下钻拆解 A = A1+A2+A3, A1 = B1 x C1
3.数据可视化
Excel - 必须
会做Excel制作图表,用报表工具配置可视化报表
通用能力:
1.学习能力
能够快速积累经验、学习专业技能和做事方法,把自己学习的心得进行沉淀、文档化,在他人的指导能够下完成一件一件的事情并对结果负责
2.沟通和表达能力
能够表达清楚自己的想法和期望,做事情时遇到的困难,需要的支持,对于事情的看法、观点
推荐“金字塔原理”
P6 ...
在更进一层以后,你已经有了独立面对一个方向的能力的能力,掌握了在应届生阶段的所有技能,并能指导实习生协助你一起工作
你会逐渐意识到经验的重要性,因为这个层级里面的很多知识都不是学校教给你的。“想要成功,你需要先见过体系,然后建过体系”
可能一狗离你还有点距离,但并不遥远
专业能力:
1.SQL&Python/R
SQL - 必须
通常在这个级别,还是需要自己写代码提数的...而且还要带实习生一起干。你已经可以通过百度熟练解决各种SQL提取问题,包括窗口函数、正则表达式、子查询、UDF等都能抄着用用
对于Hive/Hadoop也有所了解,开始会考虑数据的运行效率、解决数据偏斜问题
Python和R - 可选
对于正常的数据分析师来说,一般只有部分研究性项目会考虑用到Python和R,比如让你画个热力地图,跑个统计算法之类的
SPSS这种专业工具也挺好的,但是要注意合规性
特征学习大部分情况下都是提需求给到对应的算法/RD团队
2.数据仓库
数据仓库模型 - 必选
在知道数据的使用链路以后,你还需要了解数据的加工链路,包括数据仓库模型分层的逻辑,生产数据层、明细层、汇总/主题层、应用层
你知道为了你要看的数据,需要在现有数据上如何增加出一个新的数据结构,来满足你的需求。注意尽量选取通用化、中台化的数据结构,而不是一个主题一个主题的数据烟囱
数据资产 - 可选
指标口径、数据加工流程标准化这两个是必须的,此外希望你有编写流程、规范、指导文档的能力,这些都是你能留下来的数据资产
3.数据分析
在基础分析方法上,增加以下内容:
指标体系 - 必选
你需要了解如何建立指标体系,数据分析最重要的一点就是“所有业务数据化,所有数据业务化”
指标体系代表了业务关键节点的数据化定义,数据展示方法代表了你对业务的分析思路,基于管理层核心KPI和业务运转方式中的各个关键节点,去定义T1级别核心指标,分拆至各个产品、渠道、事业部、区域等维度,下钻拆解为次级细分指标
方向经验 - 至少有一个
你需要对一个业务方向的数据分析有充足的经验,了解业务是如何开展的,可以使用哪些通用的分析模型
以用户分析为例:
1)对需要研究的全部用户定性分群,最出名的是AARRR,我喜欢AIPL
2)依照用户的表现(行为标签)和价值做二次细分,RFM、FAST、GROW之类的
获客阶段希望你可以说清楚是分哪些渠道、端、投放方式,然后方式有哪些,对应的数据应该怎么抓取(埋点、DSP),每个渠道投放的ROI如何评估及改善(PV、UV、转化率和投入),如何设定不同的实验来验证有效性(A/B测试,分桶,分组别对比引流、付费、留存率等)
然后运营阶段和获客阶段类似,你需要知道如何基于用户的行为、表现做二次分层,打上行为标签。一种类似于RFM、另一种是用户在APP/网页中浏览触发埋点,聚合成路径的标签。然后这两种标签打上之后,如何通过优惠券、促销、PUSH等方式来刺激用户
基础能力:
在“学习能力”、“沟通和表达能力”基础上增加
1.需求处理及项目跟进
你需要在自己的领域判断需求优先级,跟进项目进度,同时具备有写简单BRD的能力
你会逐渐意识到经验的重要性,因为这个层级里面的很多知识都不是学校教给你的。“想要成功,你需要先见过体系,然后建过体系”
可能一狗离你还有点距离,但并不遥远
专业能力:
1.SQL&Python/R
SQL - 必须
通常在这个级别,还是需要自己写代码提数的...而且还要带实习生一起干。你已经可以通过百度熟练解决各种SQL提取问题,包括窗口函数、正则表达式、子查询、UDF等都能抄着用用
对于Hive/Hadoop也有所了解,开始会考虑数据的运行效率、解决数据偏斜问题
Python和R - 可选
对于正常的数据分析师来说,一般只有部分研究性项目会考虑用到Python和R,比如让你画个热力地图,跑个统计算法之类的
SPSS这种专业工具也挺好的,但是要注意合规性
特征学习大部分情况下都是提需求给到对应的算法/RD团队
2.数据仓库
数据仓库模型 - 必选
在知道数据的使用链路以后,你还需要了解数据的加工链路,包括数据仓库模型分层的逻辑,生产数据层、明细层、汇总/主题层、应用层
你知道为了你要看的数据,需要在现有数据上如何增加出一个新的数据结构,来满足你的需求。注意尽量选取通用化、中台化的数据结构,而不是一个主题一个主题的数据烟囱
数据资产 - 可选
指标口径、数据加工流程标准化这两个是必须的,此外希望你有编写流程、规范、指导文档的能力,这些都是你能留下来的数据资产
3.数据分析
在基础分析方法上,增加以下内容:
指标体系 - 必选
你需要了解如何建立指标体系,数据分析最重要的一点就是“所有业务数据化,所有数据业务化”
指标体系代表了业务关键节点的数据化定义,数据展示方法代表了你对业务的分析思路,基于管理层核心KPI和业务运转方式中的各个关键节点,去定义T1级别核心指标,分拆至各个产品、渠道、事业部、区域等维度,下钻拆解为次级细分指标
方向经验 - 至少有一个
你需要对一个业务方向的数据分析有充足的经验,了解业务是如何开展的,可以使用哪些通用的分析模型
以用户分析为例:
1)对需要研究的全部用户定性分群,最出名的是AARRR,我喜欢AIPL
2)依照用户的表现(行为标签)和价值做二次细分,RFM、FAST、GROW之类的
获客阶段希望你可以说清楚是分哪些渠道、端、投放方式,然后方式有哪些,对应的数据应该怎么抓取(埋点、DSP),每个渠道投放的ROI如何评估及改善(PV、UV、转化率和投入),如何设定不同的实验来验证有效性(A/B测试,分桶,分组别对比引流、付费、留存率等)
然后运营阶段和获客阶段类似,你需要知道如何基于用户的行为、表现做二次分层,打上行为标签。一种类似于RFM、另一种是用户在APP/网页中浏览触发埋点,聚合成路径的标签。然后这两种标签打上之后,如何通过优惠券、促销、PUSH等方式来刺激用户
基础能力:
在“学习能力”、“沟通和表达能力”基础上增加
1.需求处理及项目跟进
你需要在自己的领域判断需求优先级,跟进项目进度,同时具备有写简单BRD的能力
P6+ ...
关于P6和P6+的区别,主要是阿里职级的P6太宽泛了,放到其他公司通常可以对应2-4个职级,就拆开来讲了。毕竟1狗和2狗的差距还挺大的
专业能力
1.SQL&Python/R
SQL - 可选
Python/R - 可选
在这个职级,代码能力对于分析师来说的重要性开始降低了,你会开始将自己的精力更多的放在专项研究、体系搭建上面,需要你提数的场合变少了
有财务、投资、用研这些特殊经验的话、没有代码能力也可以
2.数据仓库
同P6,你已经了解数据是如何生产的,至于数据架构...和你也没什么关系
3.数据分析
在这个职级,你需要对一个产品线/事业部级别的全面了解,比如说某个事业部的整体经营分析,用户、体验、流量、订单、供应链、商品...
你脑海开始具有了商业模式的雏形:
你所在的事业部的经营状况如何?年度目标是什么?预算拆分的逻辑、执行期关注的核心指标有哪些?核心指标与各个部门的老板有什么关系?在各个部门内部,又是如何通过核心指标和衍生指标来进行决策、评估业务行为的?
或者也可以是某个专题的公司级分析,比如对整体财务分析&财管报出具
通用能力
1.找资源、推进项目的能力
需要有独立推动小型项目的能力、并能够发挥自己在公司内部的影响力搞定事情
2.初级管理(向上、横向管理)
在这个级别主要的是向上管理和横向管理,在你的领导、同事心中建立影响力
专业能力
1.SQL&Python/R
SQL - 可选
Python/R - 可选
在这个职级,代码能力对于分析师来说的重要性开始降低了,你会开始将自己的精力更多的放在专项研究、体系搭建上面,需要你提数的场合变少了
有财务、投资、用研这些特殊经验的话、没有代码能力也可以
2.数据仓库
同P6,你已经了解数据是如何生产的,至于数据架构...和你也没什么关系
3.数据分析
在这个职级,你需要对一个产品线/事业部级别的全面了解,比如说某个事业部的整体经营分析,用户、体验、流量、订单、供应链、商品...
你脑海开始具有了商业模式的雏形:
你所在的事业部的经营状况如何?年度目标是什么?预算拆分的逻辑、执行期关注的核心指标有哪些?核心指标与各个部门的老板有什么关系?在各个部门内部,又是如何通过核心指标和衍生指标来进行决策、评估业务行为的?
或者也可以是某个专题的公司级分析,比如对整体财务分析&财管报出具
通用能力
1.找资源、推进项目的能力
需要有独立推动小型项目的能力、并能够发挥自己在公司内部的影响力搞定事情
2.初级管理(向上、横向管理)
在这个级别主要的是向上管理和横向管理,在你的领导、同事心中建立影响力
P7 ...
P7基本就是年入百万的级别啦,当然会有股票、期权、各种福利拼拼凑凑...纯工资百万比较难
专业能力上,和P6+的差距在对业务的影响力、商业模式理解上
专业能力
1.数据仓库
资源和预算考量 - 必须
你需要对数据的生产链路和使用链路非常熟悉,明晰这两者是如何关联的,如何根据业务量级去考虑对应的研发团队、机器资源预算,推动研发同学进行数据治理、效率提升也是你的工作之一
2.数据分析
复杂业务下的多场景分析能力 - 必须
参考P6+,从广度上来说,这时候你具有的是公司多条产品线的综合分析能力;从深度上来说,你不仅在执行期可以监控业务的发展,你会更多的介入到预算的制定,如果用dota来瞎举例的话:
你的战略目标是赢下比赛,通过历史测算或者经验数据,你知道10分钟C位如果能打5000块的话,赢面就很大
那么在执行的时候,其中一个目标就是给C位10分钟打5000块钱,拆分到对线期补兵3500,补双野1500;对线期补兵的3500拆分到行为,就是前十分钟正反补不漏超过五个刀,双野同理拉到几波
然后在预算制定时,你就需要关注,是不是选了辅助去拉双野,而且选了适合屯野而不是游走gank的辅助,本身5000的目标是否合适于现在的版本这些问题
3.商业模式理解
你深入的理解这个公司的各个模块是如何运转的,业务部门的战略方向及行动,以及业务部门的行为如何影响财务指标,各种指标的标准值、目前数值和理想模型的差距...
专业能力上,和P6+的差距在对业务的影响力、商业模式理解上
专业能力
1.数据仓库
资源和预算考量 - 必须
你需要对数据的生产链路和使用链路非常熟悉,明晰这两者是如何关联的,如何根据业务量级去考虑对应的研发团队、机器资源预算,推动研发同学进行数据治理、效率提升也是你的工作之一
2.数据分析
复杂业务下的多场景分析能力 - 必须
参考P6+,从广度上来说,这时候你具有的是公司多条产品线的综合分析能力;从深度上来说,你不仅在执行期可以监控业务的发展,你会更多的介入到预算的制定,如果用dota来瞎举例的话:
你的战略目标是赢下比赛,通过历史测算或者经验数据,你知道10分钟C位如果能打5000块的话,赢面就很大
那么在执行的时候,其中一个目标就是给C位10分钟打5000块钱,拆分到对线期补兵3500,补双野1500;对线期补兵的3500拆分到行为,就是前十分钟正反补不漏超过五个刀,双野同理拉到几波
然后在预算制定时,你就需要关注,是不是选了辅助去拉双野,而且选了适合屯野而不是游走gank的辅助,本身5000的目标是否合适于现在的版本这些问题
3.商业模式理解
你深入的理解这个公司的各个模块是如何运转的,业务部门的战略方向及行动,以及业务部门的行为如何影响财务指标,各种指标的标准值、目前数值和理想模型的差距...
后话 ...
感谢你看到这里,写这篇文章主要是想起了自己1年半以前的疑惑,具体见下贴:
[url]https://bbs.nga.cn/read.php?pid=328177654&opt=128[/url]
感谢那位楼主,也希望可以给那时候的自己做个解答
现在的路径有3条:
1.走产品路线,转产品经理,有数据产品、数据仓库两条路
2.走管理路线,数据分析团队的管理者,带团队搭体系,最后转业务
3.走研究路线,做行业研究/算法研究,需要很强的学术能力
[url]https://bbs.nga.cn/read.php?pid=328177654&opt=128[/url]
感谢那位楼主,也希望可以给那时候的自己做个解答
现在的路径有3条:
1.走产品路线,转产品经理,有数据产品、数据仓库两条路
2.走管理路线,数据分析团队的管理者,带团队搭体系,最后转业务
3.走研究路线,做行业研究/算法研究,需要很强的学术能力