数据科学 - 统计学简介


统计学概论

统计学是分析数据的科学。

当我们创建预测模型时,我们必须评估预测的可靠性。

毕竟,如果我们不能依赖预测,那么它还有什么值呢?


描述性统计

我们将首先介绍一些基本的描述性统计数据。

描述性统计总结了数据集的重要特征,例如:

  • 数数
  • 标准差
  • 百分位数
  • 平均的
  • ETC..

这是熟悉数据的良好起点。

我们可以使用describe()Python 中汇总数据的函数:

示例

print (full_health_data.describe())
亲自试一试 »

输出:

Stat Describe

你在这里看到什么有趣的事情了吗?