目录

Pandas - 绘图



绘图

Pandas使用plot()创建图表的方法。

我们可以使用 Pyplot(Matplotlib 库的子模块)在屏幕上可视化图表。

在我们的文章中阅读有关 Matplotlib 的更多信息Matplotlib 教程

示例

从 Matplotlib 导入 pyplot 并可视化我们的 DataFrame:

import pandas as pd
import matplotlib.pyplot as plt

df = pd.read_csv('data.csv')

df.plot()

plt.show()
亲自试一试 »

本页中的示例使用名为“data.csv”的 CSV 文件。

下载数据.csv或者打开数据.csv


散点图

指定您想要一个散点图 kind参数:

kind = 'scatter'

散点图需要 x 轴和 y 轴。

在下面的示例中,我们将使用 "Duration" 作为 x 轴,使用 "Calories" 作为 y 轴。

包括 x 和 y 参数,如下所示:

x = 'Duration', y = 'Calories'

示例

import pandas as pd
import matplotlib.pyplot as plt

df = pd.read_csv('data.csv')

df.plot(kind = 'scatter', x = 'Duration', y = 'Calories')

plt.show()

结果

亲自试一试 »

记住:在前面的示例中,我们了解到 "Duration" 和 "Calories" 之间的相关性是0.922721,我们得出的结论是,持续时间越长意味着燃烧的卡路里越多。

通过查看散点图,我会同意。

让我们创建另一个散点图,其中列之间存在不良关系,例如 "Duration" 和 "Maxpulse",相关性0.009403:

示例

列之间没有关系的散点图:

import pandas as pd
import matplotlib.pyplot as plt

df = pd.read_csv('data.csv')

df.plot(kind = 'scatter', x = 'Duration', y = 'Maxpulse')

plt.show()

结果

亲自试一试 »


直方图

使用 kind指定您想要直方图的参数:

kind = 'hist'

直方图只需要一列。

直方图向我们显示每个间隔的频率,例如 50 到 60 分钟之间持续了多少次锻炼?

在下面的示例中,我们将使用 "Duration" 列来创建直方图:

示例

df["Duration"].plot(kind = 'hist')

结果

亲自试一试 »

笔记:直方图告诉我们有超过 100 次持续时间在 50 到 60 分钟之间的锻炼。


通过练习测试一下

练习:

插入正确的语法,将 DataFrame 中的数据可视化为图表(绘图)。

df.()

开始练习