目录

机器学习 - 正态数据分布


正态数据分布

在上一章中,我们学习了如何创建一个给定大小且在两个给定值之间的完全随机数组。

在本章中,我们将学习如何创建一个数组,其中的值集中在给定值周围。

在概率论中,这种数据分布被称为正态数据分布, 或者高斯数据分布,是在数学家卡尔·弗里德里希·高斯 (Carl Friedrich Gauss) 提出这个数据分布的公式之后。

示例

典型的正态数据分布:

import numpy
import matplotlib.pyplot as plt

x = numpy.random.normal(5.0, 1.0, 100000)

plt.hist(x, 100)
plt.show()

结果:

运行示例 »

笔记:正态分布图也称为钟形曲线因为它具有钟形的特征。

直方图解释

我们使用来自numpy.random.normal()方法,具有 100000 个值,绘制包含 100 个条形的直方图。

我们指定平均值为 5.0,标准差为 1.0。

这意味着这些值应集中在 5.0 左右,并且很少与平均值相差超过 1.0。

从直方图中可以看到,大多数值都在 4.0 到 6.0 之间,顶部大约为 5.0。