数据分析的体会 数据分析总结

2023-04-16 05:01:00 来源 : haohaofanwen.com 投稿人 : admin

下面是好好范文网小编收集整理的数据分析的体会 数据分析总结,仅供参考,欢迎大家阅读!

数据分析的体会

课程接近尾声,为了巩固所学知识,更为了能够整理出自己一套知识体系,也方便其他人参考,所以决定写了这篇文章。

最开始选择猴子老师的是由于(1)面对一堆数据不知道如何下手分析才更有条理,自己分析的时候也知道从多角度出发入手,但是这个角度选择没有一个好的思路;(2)之前分析比较浅显较,只是看出来发生了什么即现象,没有观察现象发生的原因以及有什么应对策略,这才是重点;

下面进入正题,面对一个数据分析项目如何下手?本节先从理论进行说明。

一般流程是数据理解→明确问题→制定分析思路→数据清洗→数据分析→数据可视化→写分析报告

理解数据

(1)理解业务数据,根据分析目标,提取有用数据,如何探索数据;

(2)会使用相关指标分析数据,可以使用多个指标从多个角度分析问题。

1、如何理解数据?

(1)目前存在的数据,有哪些库,哪些表以及字段含义和计算方法;

(2)对数据进行分类:按照用户数据、行为数据、商品数据;

(3)了解目前有哪些报表,各种报表中的业务指标含义等(用来观察表象,从而明确问题);

2、业务指标

(1)常用业务指标:用户数据指标、行为数据指标、商品数据指标、推广付费指标;

(2)总结所在行业业务指标

(3)如何选择指标:好的指标应该是比率,北极星指标:业务核心指标

3、指标体系

(1)指标体系的作用:

监控业务情况(表象);通过拆解业务指标寻找当前业务问题;评估可改进的地方和下一步方向;

(2)构建指标体系的方法:

找一级指标(核心指标)→找二级指标(根据业务运营情况)→找三级指标(梳理业务流程)

4、报表

报表就是通过表和图展示指标,从而方便业务部门掌握业务情况。

(1)报表制作流程:需求分析、建立指标体系、设计展示形式、编写需求文档、报表开发。

通过报表监控指标,不断更新指标体系。

5、小结

所以成熟的公司已经有了一些报表,然后通过报表监控指标业务情况,发现业务问题,明确问题后,进一步分析找原因,提出相应决策,重复该过程。

对于不成熟的公司,可能没有完整或者压根没有的指标体系和报表,只有杂乱无章的数据,就需要从头梳理(与业务部门包括产品部门、运营部门、市场部门等沟通),理解数据,找到核心业务指标,搭建指标体系,制定报表,监控报表,发现问题,制定决策,同时不断更新指标体系和报表,这样形成一个闭环。

个人觉得建立指标体系过程与数据分析过程异曲同工,都明确业务问题后,多维度拆解(按照指标拆解、按照流程拆解)等分析方法进行分析,层层深入。

明确问题(现象是什么?)

通过观察现象把问题定义清楚,这是数据分析的第1步。

明确问题的方法:

(2)业务指标理解:指标的含义、和谁比;若没有指定指标,则选择业务核心指标。

制定分析思路

对明确的问题如何展开后面的分析,先利用思维导图等方式梳理清楚,可以利用分析方法进行梳理,使得分析思路更加清晰。

分析方法:

(1)多维度拆解分析方法:将提出的问题拆解成简单的子问题(本质其实是逻辑树分析方法);

(2)对比分析法:和谁比(自己还是行业比);如何比较;

(3)假设检验法:分析原因(如何提出假设,收集证据和得出结论);

(4)PEST法:当做行业分析时可以使用(政策、经济、社会、技术);

(5)相关分析:对于分析出的原因,可以判断一下哪个原因相关性更高,更需要优先解决;

数据清洗

数据清洗7步骤:

(1)选择子集(不需要的列隐藏)

(2)列名重命名

(3)删除重复值

(4)缺失值处理{查找缺失值【统计每一列的有值的个数】、处理缺失值【补全(excel查找空白值,填写后按ctrl+enter)、删除、平均值代替缺失值、统计模型算代替】}

(5)一致化处理(格式一致性;错误值:查找筛选、查找替换)

分列功能

文本函数:查找函数find()、字符串截取函数【left()、right()、mid()函数】

日期格式处理:分列选择日期格式,单元格格式选择日期

使用数据透视表按照年、月、星期粒度汇总数据;

(6)数据排序(了解数据特征)

(7)异常值处理

数据透视表定位、查找异常值

利用四分位数定位、查找异常数值

数据分析

描述性分析

通过分析思路对数据进行描述性分析,从而发现问题。

分析原因

对发现的问题,应用分析方法找到问题原因:

我们可以在分析的过程中使用这3步来分析:

(1)使用“多维度拆解分析方法"(维度(角度)+拆解(加法))对问题进行拆解,将一个复杂问题细化成各个子问题;

“多维度拆解分析方法”来拆解问题的时候,我们可以按用户、产品、竞品这3个维度来拆 解。这3个维度分别对应三个公司的部门,有利于把问题说清楚。用户对应运营部,产品对应产品部,竞品对应市场部。

用户(运营部):画出用户使用产品的路径图去分析原因。

产品(产品部):考察这段时间销售的产品是否符合用户的需求。

竞品(市场部):考察竞争对手是不是在搞什么优惠活动,用户跑到那里了。

多维度拆解的方法还可以根据业务指标构成拆解和业务流程拆解。

(2)对拆解的每个部分,使用“假设检验分析方法”找到哪里出了问题。分析的过程可以用“对比分析方法”等多个分析方法来辅助完成;

假设检验步骤:提出假设、收集证据、得出结论;其中提出假设可以通过三种方法进行拆解提出:第一种:三个部门维度同上;第二种4P理论:产品、价格、渠道、促销;第三种:业务流程。

可用以上模板:

(3)在找到哪里出了问题以后,可以多问自己“为什么出现了这个问题”,然后使用“相关分析方法”进行深入分析。

提出建议

对找到的原因提出建议。在决策这一步,常用的分析方法是:

(1)回归分析

为什么用:一般问题发生的原因有多种,所以第2步找到的原因不会只有一种。在第3步决策阶段,需要提出建议。这些原因和目标都相关,如果建议只是说a和b高度相关,那么,你的领导是无法根据“相关”采取具体的行动。

(2)AARRR分析方法(AARRR模型可以帮助我们分析产品的用户行为,可以在不同的阶段制定不同的运营策略,从而实现用户增长)

(1)获取用户(Acquisition):用户如何找到我们?

三类渠道:搜索引擎,付费渠道和口碑渠道:

渠道曝光量:有多少人看到产品推广的信息;

渠道转换率:有多少人因为看到广告转换成用户;

日新增用户数:每天新增用户是多少;

日应用下载量:每天有多少用户下载了产品;

获客成本:获取一个客户所花费的成本。

(2)激活用户(Activation):用户的首次体验如何?

“啊哈时刻”

优化流程、激活用户还可以通过游戏的玩法,给用户发放奖励来唤醒用户,比如打卡、积分、发优惠券等

活跃率

(3)提高留存(Retention):用户会回来吗?

留存率

用群组分析方法来找到原因

留存的核心目标是让用户养成使用习惯。

(4)增加收入(Revenue):如何赚到更多钱?

用来衡量业务总量的指标,比如成交总额,成交数量

用来衡量每个人平均的指标,比如客单价

用来衡量付费情况的指标,比如付费率,复购率

评估这些常见的夹点

转发率、转化率、K因子

数据可视化

(1)图表六元素:标题、横纵轴标题、类别名称、图例、网格线、数据来源

(2)4种常见的图形:散点图、折线图、柱状图、条形图

散点图应用场景:两个指标相互之间关系(机器学习的回归分析常用图形)

折线图应用场景:时间序列的数据可视化

柱状图应用场景:堆积柱状图:比较各类别总体比较,而且还可以比较各类子成分,有个缺点比较其他子成分比较难

瀑布图:处理堆积柱状图一部分比较或者展示起点和终点中间上升或者下降的变化

直方图:对于连续数据集(例如身高)查看各个类别的分布(推论统计分析)

条形图应用场景:与柱状图一样(更直观)

堆积条形图:

其他图像:饼图:占比(避免使用)

箱线图:4分位数

热力图

雷达图

词云图

漏斗模型(AARRR)

(3)面对不同的业务场景选择图形

分析报告

分析报告内容按照这样排版更清晰:

1、分析背景

介绍本次分析的意义,可以包括分析背景介绍、数据背景介绍、数据字段的含义等

2、分析目的

通过分析要解决什么问题,要达到什么效果。

3、分析思路

分析思路是指如何开展你的分析,也就是先分析什么,再分析什么。

使用的方法:思维导图

用提问的方式将分析思路中的内容罗列出来,这些问题也可作为后面“分析内容”的小标题,并且顺序也一一对应,这样子数据分析报告就有逻辑性了。

商品成家量和订单量随时间变化的规律是怎样的?

用户复购率如何?复购的商品有哪些?

用户画像是什么?

哪些商品类别最受欢迎?

4、分析内容

分析内容可以按照分析思路列出的论点展开,格式:提出问题(论点)+论据(数据可视化图表)+分析结论。

5、结论

这里的结论是对上面每个论点得到的分析结论进行整理归纳,可以分点一、二、三这样列出。

6、建议

根据以上的结论,提出针对性的建议。对于好的结论,可以说怎么可以做的更好或者保持。对于不好的结论,提出如何改进。在此基础上,也可另外写出其他相关的建议。


相关文章

专题分类