目录

Pandas 数据框


什么是数据框?

Pandas DataFrame 是一种二维数据结构,如二维数组或具有行和列的表格。

示例

创建一个简单的 Pandas DataFrame:

import pandas as pd

data = {
  "calories": [420, 380, 390],
  "duration": [50, 40, 45]
}

#load data into a DataFrame object:
df = pd.DataFrame(data)

print(df) 

结果


     calories  duration
  0       420        50
  1       380        40
  2       390        45

亲自试一试 »

定位行

从上面的结果可以看出,DataFrame 就像一个有行和列的表格。

Pandas使用loc属性返回一个或多个指定行

示例

返回第 0 行:

#refer to the row index:
print(df.loc[0])

结果


  calories    420
  duration     50
  Name: 0, dtype: int64

亲自试一试 »

笔记:此示例返回一个 Pandas系列

示例

返回第 0 行和第 1 行:

#use a list of indexes:
print(df.loc[[0, 1]])

结果


     calories  duration
  0       420        50
  1       380        40

亲自试一试 »

笔记:使用时[],结果是一个 Pandas数据框



命名索引

随着index参数,您可以命名自己的索引。

示例

添加名称列表,为每一行指定一个名称:

import pandas as pd

data = {
  "calories": [420, 380, 390],
  "duration": [50, 40, 45]
}

df = pd.DataFrame(data, index = ["day1", "day2", "day3"])

print(df) 

结果


        calories  duration
  day1       420        50
  day2       380        40
  day3       390        45

亲自试一试 »

查找命名索引

使用命名索引loc属性返回指定的行。

示例

返回"day2":

#refer to the named index:
print(df.loc["day2"])

结果


  calories    380
  duration     40
  Name: day2, dtype: int64

亲自试一试 »

将文件加载到 DataFrame 中

如果您的数据集存储在文件中,Pandas 可以将它们加载到 DataFrame 中。

示例

将逗号分隔的文件(CSV 文件)加载到 DataFrame 中:

import pandas as pd

df = pd.read_csv('data.csv')

print(df) 
亲自试一试 »

您将在接下来的章节中了解有关导入文件的更多信息。


通过练习测试一下

练习:

插入正确的 Pandas 方法来创建 DataFrame。

pd.(data)

开始练习