摘要:本篇文章通过举例告诉大家数据分析师的日常工作介绍,希望对即将学习数据分析或者入行数据分析的你有所帮助。
本篇文章通过举例告诉大家数据分析师的日常工作介绍,希望对即将学习数据分析或者入行数据分析的你有所帮助。
最近,有不少粉丝在后台留言问我想学数据分析,但是数据分析师的日常工作是什么呢?
首先我必须说,没有什么工作是容易的。
数据分析师是什么样子的呢?
在你的眼里他们制作报表,看起来好高大上,很炫酷,很漂亮!
在你的眼里他们是大数据领域的工作者,处于时代的前列,很潮!
在你的眼里他们待遇好,白领,挣的钱多!
其实他们也像是搬砖的,搬数据,数据种类多,量大,变化快,数据里空值,乱码,重复,什么情况都有,数据很乱,数据源很多,来自app的,web端的,日志,外部api等等,要理清逻辑,清洗数据,清晰的分层,需要下很多功夫。
他们天天要用hue跑数据,对数据,有时候还会碰到数据倾斜问题,如果没找到原因,会跑一天时间,还没验证数据;
有时候为了验证数据和仓库工程师吵架,有时候是为了取数口径,有时候为了调度,数据为什么还没出来,各种扯皮的事情;
有时候对数据和业务还有运营吵架,有可能是为了需求,有可能是为了口径;
但是又是谁的生活容易!
你的高度,取决于与你并肩的人以及你自己
有一群人,他们站在IT界的前沿,
他们在这里学习,转型,优化,进阶,攀登下一座高峰。
这是他作为数据分析师工作的一天。
9:00,接任务
被安排了一个紧急的任务,要通过数据分析发现公司近期营收下跌背后的真正原因,并提出有针对性的业务建议。
9:30,谈需求
需要联系相关接口人谈需求,了解这次分析的背景、目标、涉及部门、之前做了哪些工作、达成效果,以及要工作资料文档等,此时沟通就显得很重要。
10:00,拟思路
打开脑图工具,开始梳理分析思路。通过对指标的层层拆解细化,找出导致营收下滑的根本原因,以“对症下药”。他知道做数据分析就是为了解决实际问题,而解决问题必须要有一些方法论来指导,例如结构化思维、金字塔原理、5W2H等。之所以这么快就梳理好分析思路,还得益于自己对公司数据的了解,公司情况,业务和数据。
11:00,定指标
把思路给领导看,得到肯定后,根据思路设计分析指标。这可能是最能体现一个数据分析师“功力”的地方之一。
用EXCEL将思路中各部分的分析点转化为相应的指标、汇总的维度以及合适的结果形式,以便做分析和图表可视化。关于指标的设计,除原始指标,还有趋势、占比、环比、同比等。
除此之外,给出了数据统计的时间范围、来源表、具体指标的计算逻辑、等等。
11:30,取数据
快速地将各个指标转化成为一行行SQL代码
14:00,做分析
得到数据后首先粗略看一下数据结果的准确性,详细看一下每部分的结果,认真思考从结果中得出什么样的数据结论。再进一步,基于初步得出的数据结论,思考如何用图表来展现出来。
16:45,写报告
按照分析思路首先整理出大体的PPT报告框架,然后在框架的基础上,将各部分内容丰富起来。
18:00,改报告
总结下来所涉及的内容包含:收集数据,数据清洗,数据可视化,数据方向建设和规划和数据报告展示。
其实每个公司的数据分析师其职责都是不太相同的,大公司对数据分析师要求更细化,而初创公司的要求就是需要数据分析师是个多面手。另外不同领域的数据分析师需要擅长的工具和工作细则也是不同的。
收集数据
数据分析师的工作第一步就是收集数据,如果是内部数据,可以用SQL进行取数,如果是要获取外部数据,数据的可靠真实性和全面性其实很难保证。在所有获取外部数据的渠道中,网络采集越来越受到大家的关注。网络采集最常用的方法是通过爬虫获取数据,相比较而言,编写爬虫程序获取到的海量数据更为真实、全面,在信息繁荣的互联网时代更为行之有效。如果是分布式系统的大数据,使用Hadoop和Apache Spark两者进行选取和清理。
可以看出,光是收集数据就要用到各种不同的计算机语言和知识了。如果一个数据分析师只会SQL取数是不够的,会逐渐被市场淘汰。因为SQL数据库无法支持大量的数据流量,无法支持SparkStreaming的实时数据采集。
数据清洗
数据清洗是整个数据分析过程中不可缺少的一个环节,其结果质量直接关系到模型效果和最终结论。在实际操作中,数据清洗通常会占据分析过程的50%—80%的时间。需要进行处理的数据大概分成以下几种:缺失值、重复值、异常值和数据类型有误的数据。
数据可视化
是为了准确且高效、精简而全面地传递出数据带来的信息和知识。可视化能将不可见的数据现象转化为可见的图形符号,能将错综复杂、看起来没法解释和关联的数据,建立起联系和关联,发现规律和特征,获得更有商业价值的洞见和价值。在利用了合适的图表后,直截了当且清晰而直观地表达出来,实现了让数据说话的目的。人类右脑记忆图像的速度比左脑记忆抽象的文字快100万倍,这也就是为什么数据可视化能够加深和强化受众对于数据的理解和记忆。小职在商业数据分析推荐使用Tableau, 5分钟出数据可视化,无脑开挂了解一下?
数据方向建设和规划
不同行业和领域的侧重点是不同的,可以是商业策略,也可以是市场营销,是不固定的,要依据公司的战略发展走。许多行业都是需要数据分析师的存在,像金融、制药、生物、政治、历史、经济、新闻传媒、物流、时尚、旅游、环保……对一个领域有了充分的理解和在该领域深入从事的经验,进而体现在数据分析上时,能够更好地发现并定义出实际的问题,也就可以在数据分析之后更符合行业发展规律地去改进问题。
数据报告展示
在小职看来,最可以体现数据分析师价值的点就在于通过数据给业务带来价值。数据分析师作为业务与IT的桥梁,与业务的需求沟通是其实是数据分析师每日工作的重中之重。在明确了分析方向之后,能够让数据分析师的分析更有针对性。如果没和业务沟通好,数据分析师就开始撸起袖子干活了,往往会是白做了。最后结果的汇总体现也非常重要,不管是PPT、邮件还是监控看板,选择最合适的展示手段,将分析结果展示给业务团队。
小职理解的数据分析师是个很大的概念,可以说数据分析是工具,就好像统计也好,数学也好,计算机技术也好……都是我们在工作时手上的武器,无论什么样的武器最终目的都是为了可以更了自己所处的领域,并用武器从数据中洞察出问题,运用分析思维,去解决实际问题,这才是数据分析师的价值。
职坐标数据分析课程从入门到实战项目,让你快速掌握企业所需前沿技术,助你在6个月挑战高薪入职。
我在“职坐标在线”公众号等你,记得找我领取免费干货资源。
您输入的评论内容中包含违禁敏感词
我知道了
请输入正确的手机号码
请输入正确的验证码
您今天的短信下发次数太多了,明天再试试吧!
我们会在第一时间安排职业规划师联系您!
您也可以联系我们的职业规划师咨询:
版权所有 职坐标-一站式IT培训就业服务领导者 沪ICP备13042190号-4
上海海同信息科技有限公司 Copyright ©2015 www.zhizuobiao.com,All Rights Reserved.
沪公网安备 31011502005948号