数据科学 - 绘制线性函数


运动手表数据集

看看我们的健康数据集:

期间 平均脉冲 最大脉冲 卡路里_燃烧 工作时间 睡眠时间
30 80 120 240 10 7
30 85 120 250 10 7
45 90 130 260 8 7
45 95 130 270 8 7
45 100 140 280 0 7
60 105 140 290 7 8
60 110 145 300 7 8
60 115 145 310 8 8
75 120 150 320 0 8
75 125 150 330 8 8

用 Python 绘制现有数据

现在,我们首先可以使用 matplotlib 库绘制 Average_Pulse 与 Calorie_Burnage 的值。

这个plot()函数用于制作点 x,y 的二维六边形分箱图:

示例

import matplotlib.pyplot as plt

health_data.plot(x ='Average_Pulse', y='Calorie_Burnage', kind='line'),
plt.ylim(ymin=0)
plt.xlim(xmin=0)

plt.show()
亲自试一试 »

示例解释

  • 导入matplotlib库的pyplot模块
  • 根据 Average_Pulse 和 Calorie_Burnage 绘制数据
  • kind='line'告诉我们我们想要哪种类型的情节。在这里,我们想要一条直线
  • plt.ylim() 和 plt.xlim() 告诉我们希望轴从什么值开始。在这里,我们希望轴从零开始
  • plt.show() 向我们显示输出

上面的代码将产生以下结果:

Linear function

图形输出

正如我们所看到的,Average_Pulse 和 Calorie_Burnage 之间存在关系。 Calorie_Burnage 随 Average_Pulse 成比例增加。这意味着我们可以使用 Average_Pulse 来预测 Calorie_Burnage。



为什么该线没有完全绘制到 y 轴?

原因是我们没有观察到 Average_Pulse 或 Calorie_Burnage 等于 0。 80 是 Average_Pulse 的第一个观测值,240 是 Calorie_Burnage 的第一个观测值。

Linear function

看线。如果平均脉搏从 80 增加到 90,卡路里燃烧会发生什么变化?

Linear function

我们可以使用对角线找到数学函数来预测卡路里燃烧量。

事实证明:

  • 如果平均脉搏为 80,则卡路里燃烧量为 240
  • 如果平均脉搏为 90,则卡路里燃烧量为 260
  • 如果平均脉搏为 100,则卡路里燃烧量为 280

有一个模式。如果平均脉搏增加 10,则卡路里燃烧量增加 20。