Pandas使用plot()
创建图表的方法。
我们可以使用 Pyplot(Matplotlib 库的子模块)在屏幕上可视化图表。
在我们的文章中阅读有关 Matplotlib 的更多信息Matplotlib 教程。
从 Matplotlib 导入 pyplot 并可视化我们的 DataFrame:
import pandas as pd
import matplotlib.pyplot as plt
df = pd.read_csv('data.csv')
df.plot()
plt.show()
亲自试一试 »
本页中的示例使用名为“data.csv”的 CSV 文件。
指定您想要一个散点图 kind
参数:
kind = 'scatter'
散点图需要 x 轴和 y 轴。
在下面的示例中,我们将使用 "Duration" 作为 x 轴,使用 "Calories" 作为 y 轴。
包括 x 和 y 参数,如下所示:
x = 'Duration', y = 'Calories'
import pandas as pd
import matplotlib.pyplot as plt
df = pd.read_csv('data.csv')
df.plot(kind = 'scatter', x = 'Duration', y = 'Calories')
plt.show()
记住:在前面的示例中,我们了解到 "Duration" 和 "Calories" 之间的相关性是0.922721
,我们得出的结论是,持续时间越长意味着燃烧的卡路里越多。
通过查看散点图,我会同意。
让我们创建另一个散点图,其中列之间存在不良关系,例如 "Duration" 和 "Maxpulse",相关性0.009403
:
列之间没有关系的散点图:
import pandas as pd
import matplotlib.pyplot as plt
df = pd.read_csv('data.csv')
df.plot(kind = 'scatter', x = 'Duration', y = 'Maxpulse')
plt.show()
使用 kind
指定您想要直方图的参数:
kind = 'hist'
直方图只需要一列。
直方图向我们显示每个间隔的频率,例如 50 到 60 分钟之间持续了多少次锻炼?
在下面的示例中,我们将使用 "Duration" 列来创建直方图:
笔记:直方图告诉我们有超过 100 次持续时间在 50 到 60 分钟之间的锻炼。
截取页面反馈部分,让我们更快修复内容!也可以直接跳过填写反馈内容!