数据科学 - Python 数据框


使用 Pandas 创建数据框

数据框是数据的结构化表示。

让我们定义一个包含 3 列和 5 行且带有虚构数字的数据框:

示例

import pandas as pd

d = {'col1': [1, 2, 3, 4, 7], 'col2': [4, 5, 6, 9, 5], 'col3': [7, 8, 12, 1, 11]}

df = pd.DataFrame(data=d)

print(df)
亲自试一试 »

示例解释

  • 将 Pandas 库导入为 pd
  • 在名为 d 的变量中定义包含列和行的数据
  • 使用函数 pd.DataFrame() 创建数据框
  • 数据框包含 3 列和 5 行
  • 使用 print() 函数打印数据帧输出

我们写PD。在...前面数据帧()让 Python 知道我们想要激活 Pandas 库中的 DataFrame() 函数。

注意 DataFrame 中的大写 D 和 F!


解释输出

这是输出:

Dataframe Output

我们看到"col1"、"col2" 和"col3" 是列的名称。

不要对 0-4 范围内的垂直数字感到困惑。它们告诉我们有关行位置的信息。

在 Python 中,行的编号从零开始。

现在,我们可以使用Python来计算列和行的数量。

我们可以使用 df.shape[1] 来查找列数:

示例

计算列数:

count_column = df.shape[1]
print(count_column)
亲自试一试 »

我们可以使用 df.shape[0] 来查找行数:

示例

计算行数:

count_row = df.shape[0]
print(count_row)
亲自试一试 »

为什么我们不能自己计算行和列?

如果我们处理具有许多列和行的较大数据集,那么自己计算它会很混乱。您可能会计算错误。如果我们正确使用Python中的内置函数,我们就能保证计数是正确的。