数据科学 - 统计标准差


标准差

标准差是一个描述观察结果分布程度的数字。

Standard Deviation

如果观测值是 "spread",数学函数将难以预测精确值。标准差是不确定性的度量。

低标准差意味着大多数数字接近平均值。

高标准差意味着值分布在更宽的范围内。

提示:标准差通常用符号 Sigma 表示:σ

我们可以使用std()Numpy 中的函数用于查找变量的标准差:

示例

import numpy as np

std = np.std(full_health_data)
print(std)
亲自试一试 »

输出:

Standard Deviation

这些数字意味着什么?


变异系数

变异系数用于了解标准偏差有多大。

从数学上讲,变异系数定义为:

Coefficient of Variation = Standard Deviation / Mean

如果继续执行以下代码,我们可以在 Python 中执行此操作:

示例

import numpy as np

cv = np.std(full_health_data) / np.mean(full_health_data)
print(cv)
亲自试一试 »

输出:

Coefficient of Variation

我们看到,与 Max_Pulse、Average_Pulse 和 Hours_Sleep 相比,变量 Duration、Calorie_Burnage 和 Hours_Work 具有较高的标准偏差。