如何使用excel做数据分析

数据科学 2018-01-26 1285 次浏览 0 条评论 次点赞

数据分析是什么?

5549ba64eedbb6c80d3d79537e5b0c81d663d84d.png

把隐藏在一大批看似杂乱无章的数据背后的信息集中和提炼出来,总结出研究对象的内在规律。帮助管理者进行判断和决策,以便采取适当的策略和行动。

分类:

  • 描述性数据分析:(初级数据分析 常见分析方法:对比分析法、平均分析法、交叉分析法)
  • 探索性数据分析:高级数据分析,侧重于在数据之中发现新的特征
  • 验证性数据分析:高级数据分析,高级数据分析,侧重于验证已有假设的真伪性

数据分析5个阶段

  • 数据收集 第一手数据:主要指可直接获取的数据;第二手数据:指经过加工整理后得到的数据
  • 数据处理 目的:从大量的、杂乱无章、难以理解的数据中抽取并推导出对解决问题有价值、有意义的数据
  • 数据分析 数据挖掘:一种高级的数据分析方法。主要侧重解决四类数据分析问题:分类、聚类、关联、预测
  • 数据展现 常用数据图:饼图、柱形图、条形图、折线图、散点图、雷达图、金字塔图、矩阵图、漏斗图、帕雷托图
  • 报告撰写 有一个好的分析框架,并且图文并茂,层次明晰,能够让阅读者一目了然,需要有明确的结论,有建议或解决方案

而本题讲的主要是使用excel做数据分析。其他的SPSS Statistics等暂且不提。

1、数据收集阶段:

这个阶段可以参考这个问题:国内外有哪些比较权威的统计数据网站? - 互联网,格各位知友都很热心。

2、数据处理阶段:

这个时候要用到excel了。首先要对数据进行一次大清洗!将多余重复的数据筛选清除,将缺失数据补充完整,将错误数据纠正或删除。

这个时候要用到一系列excel函数:

数据重复【(COUNTIF函数),删除重复项】
缺失数据【IF And Or 嵌套函数等】
数据抽样【Left,Right,CONCATENATE(文本1,文本2....),VLOOKUP】
数据计算【AVERAGE、SUM、MAX、MIN,Date,If】
数据分组【VLOOKUP函数,采用近似匹配,SEARCH函数】
数据抽样【RAND函数,RAND()】

以上只是一些简单的说明,具体问题需要根据需求进行分析。

3、Excel数据分析阶段:

excel数据分析-CPDA数据分析师

对比分析法:

常见的如完成值与目标值的差距,这个月与上个月的对比,同公司间各部门的对比,竞争对手行业内对比,这里要注意的是计算范围计算方法要一致,对象要一致,指标类型要一致。

结构分析法:

结构相对指标(比例)的计算公式为:

结构相对指标(比例)=(总体某部分的数值/总体总量)×100%

结构分析法的优点是简单实用,在实际的企业运营分析中,市场占有率就是一个非常经典的应用。

市场占有率=(某种商品销售量/该种商品市场销售总量)×100%

平均分析法:

算术平均数的计算公式为:

算术平均数=总体各单位数值的总和/总体单位个数

算术平均数是非常重要的基础性指标。平均数是综合指标,它的特点是将总体内各单位的数量差异抽象化,它只能代表总体的一般水平,掩盖了在平均数后各单位的差异。

平均分析法要结合各种分组和指标对比来进行。比如分析不同行业、地区的平均从业人数、平均营业收入等。总之,对于所有数量指标都可以依据不同的分组用单位数来平均,进行对比与分析。

交叉分析法:

交叉分析法通常用于分析两个变量(字段)之间的关系,即同时将两个有一定联系的变量及其值交叉排列在一张表格内,使各变量值成为不同变量的交叉结点,形成交叉表,从而分析交叉表中变量之间的关系,所以也叫交叉表分析法。交叉表当然也有二维以上的,维度越多,交叉表就越复杂,所以在选择几个维度的时候要根据分析的目的决定。下面我主要介绍二维交叉表分析法。

综合评价分析方法:

综合评价分析法的基本思想是将多个指标转化为一个能够反映综合情况的指标来进行分析评价,比如不同国家的经济实力,不同地区的社会发展水平,小康生活水平达标进程,企业经济效益评价等,都可以应用这种方法。

进行综合评价分析,主要由5个步骤,如图所示。

杜邦分析法:

杜邦分析法利用各个主要财务比率之间的内在联系,建立财务比率分析的综合模型,来综合地分析和评价企业财务状况和经营业绩的方法。采用杜邦分析图将有关分析指标按内在联系加以排列,从而直观地反映出企业的财务状况和经营成果的总体面貌。

漏斗图分析法:

漏斗图不仅能够提供用户在业务中的转化率和流失率,还揭示了各种业务在网站中受欢迎的程度。虽然单一漏斗图无法评价网站某个关键流程中各步骤转化率的好坏,但是通过前后对比或是不同业务、不同客户群的漏斗图对比,还是能够发现网站中存在的问题。

矩阵关联分析法:

关联矩阵法是常用的系统综合评价法,它主要是用矩阵形式来表示每个替代方案有关评价指标及其重要度和方案关于具体指标的价值评定量之间的关系。

其他高级分析法:

数据透视表:

这也是一个大块,需要深入的学习,有机会也会写个简单的答案。 这也是一个大块,需要深入的学习,有机会也会写个简单的答案。

4、数据展现:

根据数据关系选择图表

这部分在另一个答案里有详解的讲解对于没种类型的图表有详解的演示和说明:

  • 成分:饼图、柱形图、条形图、瀑布图
  • 排序:柱形图、条形图、气泡图、帕累托图
  • 时间序列:折线图、柱形图
  • 相关性:散点图、柱形图、对称条形图(旋风图)、散点图、气泡图
  • 多重数据比较:雷达图

图表注意事项

  • 信息完整:图表标题、单位、图例、脚注、来源等
  • 避免无意义的图表
  • 一表反映一个观点
  • 只选对的不选复杂的图表
  • 标题一句话阐述清楚反映观点

5、报告撰写

数据分析报告的作用:展示分析结果 验证分析质量 提供决策依据

报告类型:

专题分析报告

定义:对社会经济现象的某一方面或某一问题进行专门研究的一种数据分析报告
作用:为决策者制定某项政策、解决某个问题提供决策参考和依据
特点:内容的单一性 分析的深入性

综合分析报告

定义:全面评价一个地区、单位、部门业务或其他方面发展情况的一种数据分析报告
特点:全面性 联系性

日常数据通报

定义:以定期数据分析报表为依据,反映计划的执行情况,并分析其影响和形成原因的一种数据分析报告
特点:进度性 规范性 时效性

数据分析报告结构:

标题页

标题类型:解析基本观点 概括主要内容 交代分析主题 提出问题
标题要求:直接 确切 简洁

前言

分析背景:为何开展此次分析?有何意义?
分析目的:通过此次分析要解决什么问题?达到何种目的?
分析思路:如何开展此次分析?主要通过哪几方面开展?

正文

是报告最长的主体部分,包含所有数据分析事实和观点,通过数据图表和相关的文字结合分析,正文各部分具有逻辑关系

结论和建议

以上是一般的数据分析的方法和一些注意事项,事无巨细,数据分析本身就是一个慢活细活,脑力活,透过庞大的数据看本质是一个数据分析人员最应该掌握的东西。

关于Excel本身函数的指南可参考微软官方教程,《Excel 的数据分析工具》一文则重点介绍Excel 三大数据分析工具——Power Query - 数据连接、Power Pivot - 数据建模和Power View - 数据可视化。
👍

本文由 cds 整理发布,参考 CC-BY-SA 3.0 协议共享,欢迎转载、引用或改编。
感谢您的支持,以共同推动STEM公益教育!

楼主残忍的关闭了评论