机器学习统计

统计数据是获取数据问题答案的工具:

  • 什么是常见的?
  • 什么是预期的?
  • 什么是普通的?
  • 是什么可能性?

推论统计

推论统计是量化小群体特征的方法样本:

您从样本中获取数据并对整个总体进行预测。

例如,您可以站在商店询问100人样本如果他们喜欢巧克力。

根据您的研究,使用推论统计,您可以预测 91%所有购物者像巧克力一样。


令人难以置信的巧克力事实

十分之九的人喜欢巧克力。

50% 的美国人每天都离不开巧克力。

你用推论统计从小数据样本中预测整个领域。



描述性统计

描述性统计总结(描述)一组数据的观察结果。

由于我们对每个新生儿进行了登记,我们可以看出,100 名婴儿中有 51 名是男孩。

根据这些收集到的数据,我们可以预测新生儿有 51% 的机会是男孩。

令人费解的是,这一比例并不像基础生物学预测的那样为 50%。我们只知道自 17 世纪以来,我们就一直存在这种倾斜的性别比例。

笔记

原始观察只是数据。它们不是真正的知识。

你用描述性统计将原始观察结果转化为您可以理解的数据。


描述性统计测量

描述性统计分为不同的衡量标准:

趋势(中心措施)

  • Mean(平均值)值
  • 中位数(中点值)
  • 众数(最常见的值)

传播(变异性的衡量)

  • 最小值和最大值
  • 标准差
  • 方差
  • 偏度
  • 峰度