Zipf 分布用于根据 zipf 定律对数据进行采样。
齐普夫定律:在集合中,第 n 个常见术语是最常见术语的 1/n 倍。例如,英语中第五个最常见单词的出现频率几乎是最常见单词的 1/5。
它有两个参数:
a
- 分布参数。
size
- 返回数组的形状。
绘制一个 zipf 分布的样本,分布参数为 2,大小为 2x3:
from numpy import random
x = random.zipf(a=2, size=(2, 3))
print(x)
亲自试一试 »
采样 1000 个点,但仅绘制值 < 10 的点以获得更有意义的图表。
from numpy import random
import matplotlib.pyplot as plt
import seaborn as sns
x = random.zipf(a=2, size=1000)
sns.distplot(x[x<10], kde=False)
plt.show()
截取页面反馈部分,让我们更快修复内容!也可以直接跳过填写反馈内容!