小白怎么做数据分析
下面是好好范文网小编收集整理的小白怎么做数据分析,仅供参考,欢迎大家阅读!
导语|数据分析能力是各族同学都应具备的能力,无论是向老板汇报还是优化产品,好的数据分析无疑大大提高效率,本文将介绍数据分析的全流程,以及一份好的数据分析报告应该如何撰写。
一、数据分析报告类型
数据分析报告通常可以分为三类:日常分析报告、专题型分析报告和综合性分析报告。前两者是以数据+结论+建议的格式去撰写,综合性分析报告则是:行业环境调研(竞品类产品数据分析)+自身产品数据综合性分析+结论+建议。
1.1日常分析报告
呈现模式:
具有固定的时间周期,以日报、周报、月报、季报和年报的形式呈现,是定期对某一业务场景进行数据分析。
目的:
反映日常业务计划的执行情况,通过各种维度来反映业务目前现状的数据支撑,并分析其影响和原因。
格式:
描述统计类的报告,日常客观展现各类业务数据,比如针对to c系统,就是本日/周/月/销售额、平均每天的用户流失和同比环比增长的用户量等衡量维度;to b则是关注系统使用量、使用人员的身份同比变化,系统收集的单据数目等衡量维度。
但无论是tob还是toc,都要注意的是在陈列数据后对现象和原因进行分析和判断,预测未来发展趋势,并给出一定的可行性建议。重点落在宽度而不是深度。
在撰写此类数据报告时,需要贴合业务场景,搭建符合业务场景的指标体系,并需要注意以下几点:列明重点关注的数据指标、若有波动异常的数据需注明原因、对于近期关注的 重点动作注明进展。
特点:
内容宽泛,具有时效性,涵盖各类核心指标,快速出具结果。这类数据分析往往时效性较短,尤其适用于研究针对某一功能点投入业务之后的影响效果,可以帮助决策者掌握业务线的最新动态。
组成:
这类报告在撰写时的格式是大范围陈列核心指标数据(收集以时间为单位且尽可能覆盖面广的核心指标数据)+结论(针对波动较大的数据去分析其原因)+建议(尽可能以管理者视角。利用发散性思维,提出合理可行的建议)。
此类报告较为简单,往往利用普通的 excel 表格+一定量的文字说明,即可完美呈现出一份报告。
1.2 专题型分析报告
呈现模式:
无固定时间周期,有一个大方向目标,围绕某一问题进行专门研究分析的数据报告。
目的:
为决策者制定某项政策/解决问题进行专门研究的数据分析报告。
格式:
专题性分析类报告,针对某一问题进行具体的描述,分析问题出现的原因,并提出可行的解决办法,与日常分析报告不同,这类报告撰写时需要撰写报告人员对业务有深入的认识和了解,需要对数据进行一定的下钻挖掘,开始注重深度而不是宽度。
特点:
内容单一,重点突出,旨在解决核心问题。
组成:
这类报告不再是简单的陈列数据,而是需要对数据进行整合和分析,利用一些常见的分析模型如沙漏模型、事件分析模型对数据进行整合处理,并绘制相应的图表使数据展示得更加清晰直观。
在对数据进行总结时所涉及的原因思考要更加宽泛,比如一个电商app,不可以只考虑系统本身功能点,还需要考虑运营/产品在此专题角度的影响力。最终提出一个能够改善/优化某一专题的合理化建议。
因为需要陈列各类图表,设计的业务层更多,所以比起纯文字类word文件,此类报告更适合以ppt或者pdf去展示。
1.3 综合性分析报告
呈现模式:
无固定时间周期,通常是阶段性地站在一个宏观的全局角度,去全面评价部门业务或者其他发展情况。
目的:
以全局视角为决策者呈现某一产品或者业务线的综合发展情况。有助于定位产品未来的大发展方向。
格式:
综合性分析类报告,类似于专题型分析报告,不同的是其视角从一转换为多,系统性考量各类指标,考察现象之间的内部联系和外部联系。
特点:
篇幅较大、内容全面、系统分析,旨在整体客观评价某一产品或者业务的综合能力,也可以通过分析一些类似的竞品类产品,完善报告内容,使报告更加具有说服力。
组成:
这类报告涉及的范围更加广泛,可能会覆盖较多的图表,建议利用ppt/pdf或者白皮书的格式进行报告撰写。需要注意分析数据时,是以行业视角去收集下钻数据,而不是在将聚焦点落于自家产品。
举个例子,在分析自身各模块的综合表现能力的同时,可以调研同类型软件在此领域的表现能力,取其精华、舍其糟粕,旨在综合提升系统能力。
二、数据分析报告组成要素
2.1数据分析报告撰写思想
行文先重要后次要,先全局后细节,先结论后原因,先结果后过程。
结论先行,以上统下,归类分组,逻辑递进。
2.2 数据分析报告元素组成
2.2.1 整体架构
总-分-总。数据分析报告虽然没有特定的架构要求,但是总-分-总往往是最实用最有效的。将重要的结论提前,对于不太重要的内容点到为止,甚至直接舍弃一些细枝末节,这样的结构有注意加深读者的印象,使读者快速的从报告中获取到重要的信息。
2.2.2 标题
第一种 解释基本观点型:用观点句进行表示,点名报告的基本观点。
第二种 概括内容型:这类标题在叙述数据反映的基本事实,让读者迅速抓住内容重点。
第三种 交代分析主题型:这类标题类似于第一种类型,用来反映分析对象、范围、时间、方法、内容等情况,但区别是并不表明撰写人自己的观点。
第四种 提出问题型:以设问的方式提出报告所有分析的对象,引发读者的注意和思考。
但无论采用哪类报告,报告的标题都不宜过长,应精简干练、意思明确。标题不可超过20字,必要时可以采用主标题+副标题的形式进行展示。
2.2.3 目录+前沿
这一模块主要针对篇幅比较大的报告,文章篇幅如果较短不设置目录和前沿部分的可忽略不看。
目录:旨在展示出报告的分析思路,是读者对于文章的整体感受,篇幅不宜过长也不可过于简练。
前沿:
分析背景+分析目的+分析思路。分析背景主要传递此次分析的主要原因、分析的意义以及其他相关信息(比如行业的发展状况等.......)分析目的则是让读者了解到此次分析能够带来什么效果,或者可以解决什么问题。
通常情况下,分析目的和背景可以放在一页合成一个部分。
分析思路:
其实是用来指导报告撰写人如何进行完整的数据分析,这一部分主要确定需要分析的内容和方法。体现了数据分析的水平能力,比如展示了数据分析利用了哪些算法、工具和模型。
2.2.4 正文部分
正文部分是报告最长的主体部分,在这一部分进行论题的展开,并对论点进行论证,撰写者在此部分表达自己的见解和研究成果,包含了所有的数据分析事实和观点。
值得注意的是这一部分一定要采用数据图表和文字相结合的方式去呈现,并注意各部分的逻辑关系。撰写这一部分的时候可以按照以下几点宗旨:
1. 核心结论先行,由逻辑有依据
结论求精但不求多,因为大部分数据分析都是为了发现问题,报告应围绕分析的背景和目的以及要解决的问题,给出明确的答案和清晰的结论。
如果结论过多的话,反而适得其反,让人不知所云,一般情况下,一份报告有一两个总结性结论即可。
在分析的时候尽量不要有猜测性的结论,保持客观性,即使部分合理的猜测找不到直观可行的验证,也要保证其是基于合理的、有部分验证依据的,并说明是猜测。
此外,分析者不应回避“不良结论”,如果发现业务或者产品在数据准确、推导合理的情况下有一定的问题,应直接指出。
2. 结合实际业务,提出合理建议
首先,写报告时很重要的一个点就是要明确写给谁看。因为不同的目标对象所处位置不同,看问题的角度就不一样,在这里往往遵循以下特点:
高层人员更关注方向,分析报告需要提供业务的深度洞察并指出潜在的机会点。中层及员工关注具体策略,基于分析结论能通过哪些具体措施去改善现状。
其次,要结合业务实际情况去提出建议,注意方案的可行性,不宜“画大饼,盲推论”。
3. 尽量图表化,提高可读性
用图表代替大量堆叠的数字/文字,有助于读者清晰直观地看清楚问题和结论,要注意图表的元素组成是否齐全,写报告时不应直接贴图,而是在贴图的同时注意图的标题、图例、单位、脚注以及资料来源。
那么,我们应该如何确定是否要生出图表呢?
在生成图表之前先问下自己,如果我是读者,那么看到这个图之后我的感受是什么,能否有效的获取到想要获取到的信息,如果回答是肯定的,那么即可在此生成图表。
此外,对于图表的构建应该注意一张图反映一个观点,控制好变量,让读者迅速捕捉到核心思想。
并且图表模型的选择不宜过于复杂,比如能够用简单的柱状图、扇形图、折线图去传递信息时,就不要为了显得文章“高大上”而改用桑吉图、关系图、旭日图等复杂模型。
举个典型的例子:
总结一下,在撰写报告的时候尝试站在读者的⻆度去写分析报告,内容通俗易懂,⽤语规范谨慎。
2.2.5 结论部分
看到这可能你会有些疑惑,结论先行,末尾也有结论,这样去写岂不是有两个结论了?结论先行的结论:是一些较小点的结论,其目的旨在引出数据/图表。末尾的结论则是综合性较强的结论了,可以理解为各结论的汇总推论。
举个例子,分析一个从手机各部件对手机销量影响的调研报告案例:
结论先行:手机屏幕尺寸、手机重量以及镜头像素等部件对于销量的影响。
最后结论:指出在这些部件中影响力最大部件,提出一些建设性优化建议如提高像素,减轻重量等。
清楚概念之后,介绍一下结论的写作要点:
结论其实就是结合分析的实际业务场景,经过综合分析、逻辑推理,形成措辞严谨、准确且鲜明的总体论点。在撰写结论时尤其要注意结论和现状描述的区别。举个例子:x公司本季度收入100w,同比上季度增长10%。
这是我们要的结论吗?其实不是!
这只是一个针对目前公司现状的描述,若想把这一现象融合进自己的总结模块中,你需要解读数字对于公司的意义:
这个100w占比公司总收入多少?结合市场现状上升10%的增长速度是快是慢?将这些理清后再陈述出来,则是一个总结而不是现状描述。最后再针对分析出的问题,给出自己合理化的建议,可以将结论和建议写在一页纸上。
三、如何实现全流程的数据分析?
在了解了数据分析报告的元素组成部分之后,就正式进入到撰写报告的部分,在进行数据分析时,我们往往按照以下流程,进行思路的构建和文章的撰写。
step1目标确定:
目标往往来源于上级/其他部门/客户,注意目标来源于上级时,其上级身份的不同也会影响整个分析的走向,这在上文中有提到过。
而如果是自发向上的数据分析,则要依赖于可获取的数据确定方向,避免出现目标过于宏大,报告总体空洞或者阅读价值较低的情况。
step2 数据获取:
利用数据埋点后的DataInsight上报、自行利用SQL语句查询数据库、爬虫或者用户的调研问卷等形式,都可以获取到有价值的数据。
step3 数据清洗:
往往针对于利用爬虫方式得来的数据,在清洗过程中实现提取核⼼内容,去掉⽹⻚代码、标点符号等⽆⽤内容以及字段类型的变换。
step4 数据整理:
将客观数据按照某一维度整理成为可分析的数据格式,这一步可以利用excel表格、echarts、sql等工具结合分析⽬标,计算关键指标。
如果数据为表格形式,则可以计算一些二级指标,若为文字类数据,则在统计前通过关键词→标签的方式,先转换后统计。
step5 描述分析:
说这一步是最为考察分析能力的一步,这步需要对数据进行描述并且对指标进行统计。在这里可以遵循几个原则和方法:
首先是数据描述(对数据进行基本情况的刻画)可以从以下几个维度去进行基本刻画:数据总数、时间跨度、时间粒度、空间范围、空间粒度、数据来源等如果是建模,那么还要看数据的极值、分布、离散度等内容。
其次则是指标统计(报告内容的一部分),有变化、分布、对比和预测这四类指标统计逻辑。
一变化:指标随时间的变动,表现为增幅(同⽐、环⽐等)。
二分布:指标在不同层次上的表现,包括地域分布、⽤户群分布、产品分布等。
三对⽐:包括内部对⽐和外部对⽐,内部对⽐包括团队对⽐、产品线对⽐;外部对⽐则主要是与市场环境和竞争者对⽐。对比其实和分布有重叠的地⽅,但分布更多⽤于找出好或坏的地⽅⽽对⽐更偏重于找到好或坏的原因。
四预测:根据现有情况,预估下个分析时段的指标值。这一阶段的产出往往是图表。
step6 洞察结论:
做到力所能及的结论总结即可,切忌用力过猛。过于发散地去总结结论。
step7 报告撰写:
撰写报告时的主要逻辑可以遵循以下几点:
背景和⽬的决定了你的报告逻辑(解决什么问题);
数据基本情况告诉对⽅你⽤了什么样的数据,可信度如何;
分⻚内容需要按照⼀定的逻辑来构建,⽬标仍然是解决报告⽬的中的问题;
⼩结和总结必不可少;
下⼀步策略或对趋势的预测,可以近一步完善报告的内容
换个说法,其实就是议论⽂的写法⽴论(背景)——破题(⽬的)——列举论据(图表+结论)——论证论点(⼩结及总结)——结题(策略或预测)。
# 技术人说 #
本周三晚19:30,有趣有料:
一键预约⬇️
# 腾讯技术直播 #
腾讯工程师分享技术干货:
一键预约⬇️
往期文章:
设为星标,下次再见