数据科学 - 统计百分位


25%、50% 和 75% - 百分位数

百分位数在统计中用于提供一个数字,描述给定百分比的值低于的值。

Percentiles

让我们尝试使用 Average_Pulse 通过一些示例来解释它。

  • Average_Pulse 的 25% 百分位意味着所有训练课程中有 25% 的平均脉搏为每分钟 100 次或更低。如果我们翻转这一说法,则意味着 75% 的训练课程的平均脉搏为每分钟 100 次或更高
  • Average_Pulse 的 75% 百分位意味着所有训练课程中有 75% 的平均脉搏为 111 或更低。如果我们翻转这一说法,则意味着所有训练课程中有 25% 的平均脉搏为每分钟 111 次或更高

任务:找到 Max_Pulse 的 10% 百分位

以下示例展示了如何在 Python 中执行此操作:

示例

import numpy as np

Max_Pulse= full_health_data["Max_Pulse"]
percentile10 = np.percentile(Max_Pulse, 10)
print(percentile10)
亲自试一试 »
  • Max_Pulse = full_health_data["Max_Pulse"] - 将变量 Max_Pulse 从完整健康数据集中分离出来。
  • np.percentile() 用于定义我们想要 Max_Pulse 的 10% 百分位数。

Max_Pulse 的 10% 百分位为 120。这意味着所有训练课程中有 10% 的 Max_Pulse 为 120 或更低。