数据科学 - 什么是数据?


什么是数据?

数据是信息的集合。

数据科学的目的之一是构建数据结构,使其可解释且易于使用。

数据可以分为两类:

  • 结构化数据
  • 非结构化数据

非结构化数据

非结构化数据是没有组织的。我们必须组织数据以进行分析。

Unstructured Data

Unstructured Data


结构化数据

结构化数据是有组织的并且更易于使用。

Structured Data


如何构建数据?

我们可以使用数组或数据库表来构造或呈现数据。

数组示例:

[80, 85, 90, 95, 100, 105, 110, 115, 120, 125]

以下示例展示了如何在 Python 中创建数组:

示例

Array = [80, 85, 90, 95, 100, 105, 110, 115, 120, 125]
print(Array)
亲自试一试 »

在数据科学中处理非常大的数据集是很常见的。

在本教程中,我们将尽力让人们尽可能轻松地理解数据科学的概念。因此,我们将使用易于解释的小数据集。