Zipf 分布


Zipf 分布用于根据 zipf 定律对数据进行采样。

齐普夫定律:在集合中,第 n 个常见术语是最常见术语的 1/n 倍。例如,英语中第五个最常见单词的出现频率几乎是最常见单词的 1/5。

它有两个参数:

a- 分布参数。

size- 返回数组的形状。

示例

绘制一个 zipf 分布的样本,分布参数为 2,大小为 2x3:

from numpy import random

x = random.zipf(a=2, size=(2, 3))

print(x)
亲自试一试 »

Zipf 分布的可视化

采样 1000 个点,但仅绘制值 < 10 的点以获得更有意义的图表。

示例

from numpy import random
import matplotlib.pyplot as plt
import seaborn as sns

x = random.zipf(a=2, size=1000)
sns.distplot(x[x<10], kde=False)

plt.show()

结果

亲自试一试 »