分配

  • 什么是正态分布?
  • 什么是误差范围?
  • 什么是偏度?
  • 什么是峰度?

正态分布

这个正态分布曲线是一条钟形曲线。

曲线的每个带的宽度为1 标准差:

Standard Normal Distribution

曲线的每个带的宽度为 1 个标准偏差平均值

值小于1 标准差客场帐户68.27%

值小于2 个标准差客场帐户95.45%

值小于3 个标准差客场帐户99.73%

这是什么意思?

大多数观测值与平均值的偏差在 1 个标准差以内。

几乎所有观察结果都在 2 个标准差之内。

实际上所有观察结果都在 3 个标准差之内。


正态分布事实

正态分布是对称。峰值总是将分布分成两半。

正态分布是可能性分配。

许多观察结果遵循正态分布:

  • 你的智商
  • 你的体重
  • 你的身高
  • 你的薪水
  • 你的血压

正态分布表明,接近平均值的值比远离平均值的值出现的频率更高:

与平均值的距离 占人口百分比
1 标准差 68.27%
2 标准差 95.45%
3 标准差 99.73%

这个68–95–99.7 规则(又名经验规则),是记住正态分布不同带内值的百分比的简写。

正态分布也称为高斯分布钟形曲线



误差幅度

统计学家总是试图以 100% 的准确率来预测一切。

但是,总会存在一些不确定性。

这个误差范围是量化这种统计不确定性的数字。

不同的边距为我们认为可以找到正确答案的地方定义不同的范围。

可接受的余量这是一个判断问题,并且与答案的重要性有关。

我们收集的样本越多,误差幅度就越低:


Margin of Error


如何解释误差幅度

假设 55% 的抽样人群表示他们计划投票"Yes"。

将其投影到整个总体时,您可以添加/减去误差幅度以给出一系列可能的结果。

误差幅度为 3%,您确信 52% 到 58% 的人会投票"Yes"。

如果误差幅度为 10%,您确信 45% 到 65% 的人会投票"Yes"。


偏度

偏度是钟形曲线(正态分布)的扭曲(不对称)。

Skewness

峰度

峰度也是正态分布(钟形曲线)的扭曲。

偏度描述了一个尾部中的意外值,而峰度则描述了两个尾部中的意外值。

Kurtosis

图片:负峰度(低于正态分布)。

Kurtosis

图片:正峰度(高于正态分布)。