一直想知道数据分析的日常工作
日常需要做哪些事情或者典型的一天工作是怎么样的?
感谢您的分享。
1
levelworm 2022-05-20 00:29:35 +08:00
不做数据分析已经有两年了。
大致的工作流程: 和业务进行交流,写需求文档 -> 如果需要新的数据则和开发进行交流,写技术需求文档 -> 根据需求的不同,写 SQL 和 Python ,比如说如果是日常的报表则尽量自动化,进 airflow ,如果是深入的分析则需要借重 Python 更多一些。不过我没做过数据挖掘和人工智能这些,所以这块的资历还是很浅,我更喜欢工程 -> 进行数据可视化,反馈给业务。 当然现实中没有这么顺利,总有各种反复。很多时候也需要调整优先度。如果你不是很喜欢业务或者不是很喜欢做分析呢,就会比较痛苦。如果喜欢做分析的话,还要看企业是否需要数据挖掘、人工智能这些,否则其实也没什么意思。我觉得最适合做数据分析的,就是从业务转过来的人。 |
3
akira 2022-05-20 01:03:03 +08:00
无尽的报表
|
5
imn1 2022-05-20 01:14:07 +08:00
@zealboy #2
No 业务是指实际事项 数据分析往往面对的是数字、数学,例如 0 1 2 3 4 5 ,均值 2.5 、振幅 0.5~4……无论什么业务都是用一堆数字计算 而业务则是把数字和实际的意义之间的互相解读,例如上述 0~5 表示冷色调到暖色调,普遍选偏冷色调,集中选择在冷色调至中间偏暖色调……就是数字和报告的实际意义 数据分析有好多工种,不能一概而论,稀有的是建模(包括数学模型和业务模型),大量的是一般分析人员,做交叉分析统计,估计调参是最平常的工作 很多数据分析工作从进到出都是数字,很枯燥,能结合业务的会比较有意思,但出于商业保密,不一定人人都能都能同时接触两者,有时收到的都是代号 ABCDEF 之类,根本不知道表示什么 |
6
czfy 2022-05-20 03:19:54 +08:00
数据分析这 4 个字对应的工作内容,可以说是千差万别了,写代码占比从 0-100% 都有
a. 可以是搭数据 pipeline ,建立数据储存、传输、清洗、处理的流程,并持续优化 b. 可以是按着已有流程,沟通数据需求、取数、交付数据,无限循环 c. 可以是基于机器学习,利用已有数据训练各种模型、部署、回应业务需求 上面这些更偏技术向,代码必不可少 d. 可以是基于传统统计方法(回归的各种变式、网络分析、潜变量模型、聚类各种变式等等等等),对已有数据进行分析来回答业务问题 e. 可以是基于文本数据,在算法协助下做质性研究,回答业务或商业问题 后面两种完全不会写代码也能做,实际上更偏商业分析,招聘 app 上也有命名数据分析的 |