阅读 173

小白学 Python 数据分析(15):数据可视化概述

人生苦短,我用 Python

前文传送门:

小白学 Python 数据分析(1):数据分析基础

小白学 Python 数据分析(2):Pandas (一)概述

小白学 Python 数据分析(3):Pandas (二)数据结构 Series

小白学 Python 数据分析(4):Pandas (三)数据结构 DataFrame

小白学 Python 数据分析(5):Pandas (四)基础操作(1)查看数据

小白学 Python 数据分析(6):Pandas (五)基础操作(2)数据选择

小白学 Python 数据分析(7):Pandas (六)数据导入

小白学 Python 数据分析(8):Pandas (七)数据预处理

小白学 Python 数据分析(9):Pandas (八)数据预处理(2)

小白学 Python 数据分析(10):Pandas (九)数据运算

小白学 Python 数据分析(11):Pandas (十)数据分组

小白学 Python 数据分析(12):Pandas (十一)数据透视表(pivot_table)

小白学 Python 数据分析(13):Pandas (十二)数据表拼接

小白学 Python 数据分析(14):Pandas (十三)数据导出

引言

从本篇开始,整个系列进入到第二部分,数据可视化。

那么,什么是数据可视化?

可以看下下面这个动图,动图来源某云官网( data.aliyun.com/visual/data… )。

可以看到,这个动图非常的炫,那我们是不是学了数据可视化以后就能做出来这种效果。

emmmmmmmmmmmm。。。。。。。。

这个难度有点高,打怪升级也没有直接出门打 BOSS 的打法撒。

工欲善其事必先利其器

我们先看下现在使用的主流数据可视化的工具(类库)有什么。

Matplotlib

第一个当然是我们在前面开篇中介绍过的 Matplotlib , Python 数据分析经典三件套之一。

首先还是几个官方网址罗列一下,防止有的同学找不到:

GitHub:github.com/matplotlib/…

官网:www.matplotlib.org/

中文网:www.matplotlib.org.cn/

Matplotlib 的安装过程还是十分简单的:

pip install matplotlib
复制代码

等待进度条走完,我们就算安装完成了。

在学习怎么使用 matplotlib 之前,我们可以先看下 matplotlib 的一些示例:

错了错了,这么复杂的图我怎么可能画的出来。。。

下面这种才是我们的目标:

pyecharts

在除了可以使用 Matplotlib 作为数据可视化的工具之余,我们还可以选择 pyecharts 作为数据可视化工具。

先做一个简单的简介,以下内容来自官方文档:

Echarts 是一个由百度开源的数据可视化,凭借着良好的交互性,精巧的图表设计,得到了众多开发者的认可。而 Python 是一门富有表达力的语言,很适合用于数据处理。当数据分析遇上数据可视化时,pyecharts 诞生了。

相信很多同学对 Echarts 并不陌生,在做页面图表的时候,能选择的第三方支持库并不多,而 Echarts 是其中做的相当不错的一个类库,毕竟背后是由百度开源的。

放几个官方的链接:

GitHub:github.com/pyecharts/p…

官方文档:pyecharts.org/#/

接下来还是看如何安装:

pip install pyecharts
复制代码

和前面安装 Matplotlib 一样,静静的等待进度条走完就行。

这里有关版本有一点需要注意,不管是使用 Matplotlib 还是使用 pyecharts ,都需要 Python 的版本是 3.x ,在官方文档中都已经注明 2.x 不再进行维护。

至于小编为什么要介绍 pyecharts 呢?给大家看几个官方的示例:

是不是感觉单纯的从 UI 设计的角度上来讲, pyecharts 要比 Matplotlib 要好看的多,感觉 Matplotlib 像是上个世纪的产物。

在接下来的内容中,小编会先分享 Matplotlib 的使用,之后会专门写几篇介绍下 pyecharts 的使用。

数据可视化的基本流程

第一步:整理数据

数据还是数据可视化的基础,在所有的事情开始之前,需要先明确需要把哪些数据图表化。

第二步:明确目的

在上一步中,我们拿到了需要图表化的数据,接着就需要想清楚,我们展示这些数据到底是为了什么,是要表达一种趋势,还是要展现对比等等。

第三步:选择图表形式

在明确了我们的目的之后,就需要选择展现这些数据的形式了,我们需要为这些数据选择合适的展现形式,这就需要分情况讨论了。

例如我们想要展现一种趋势,那么折线图就要比柱状图更为合适,如果是需要展现对比,那么柱状图就要比折线图合适,还有是展现百分比,那么我们选择饼状图就会更为合适。

本篇的内容就到这里了,下一篇,我们接着介绍 Matplotlib 的使用姿势。

您的扫码关注,是对小编坚持原创的最大鼓励:)