目录

Pandas 简介


什么是Pandas?

Pandas 是一个用于处理数据集的 Python 库。

它具有分析、清理、探索和操作数据的功能。

名称 "Pandas" 引用了 "Panel Data" 和 "Python Data Analysis",由 Wes McKinney 于 2008 年创建。


为什么使用Pandas?

Pandas 使我们能够分析大数据并根据统计理论得出结论。

Pandas 可以清理杂乱的数据集,并使它们具有可读性和相关性。

相关数据在数据科学中非常重要。

:}

数据科学:是计算机科学的一个分支,我们研究如何存储、使用和分析数据以从中获取信息。


Pandas能做什么?

Pandas 为您提供有关数据的答案。喜欢:

  • 两列或多列之间是否存在相关性?
  • 什么是平均值?
  • 最大值?
  • 最小值?

Pandas 还能够删除不相关或包含错误值(例如空值或 NULL 值)的行。这就是所谓的打扫数据。


Pandas 代码库在哪里?

Pandas 的源代码位于此 github 存储库https://github.com/pandas-dev/pandas

{:

github:使许多人能够在同一个代码库上工作。