Pandas DataFrame 是一种二维数据结构,如二维数组或具有行和列的表格。
创建一个简单的 Pandas DataFrame:
import pandas as pd
data = {
"calories": [420, 380, 390],
"duration": [50, 40, 45]
}
#load data into a DataFrame object:
df = pd.DataFrame(data)
print(df)
calories duration 0 420 50 1 380 40 2 390 45
从上面的结果可以看出,DataFrame 就像一个有行和列的表格。
Pandas使用loc
属性返回一个或多个指定行
返回第 0 行:
#refer to the row index:
print(df.loc[0])
calories 420 duration 50 Name: 0, dtype: int64
笔记:此示例返回一个 Pandas系列。
返回第 0 行和第 1 行:
#use a list of indexes:
print(df.loc[[0, 1]])
calories duration 0 420 50 1 380 40
笔记:使用时[]
,结果是一个 Pandas数据框。
随着index
参数,您可以命名自己的索引。
添加名称列表,为每一行指定一个名称:
import pandas as pd
data = {
"calories": [420, 380, 390],
"duration": [50, 40, 45]
}
df = pd.DataFrame(data, index = ["day1", "day2", "day3"])
print(df)
calories duration day1 420 50 day2 380 40 day3 390 45
使用命名索引loc
属性返回指定的行。
返回"day2":
#refer to the named index:
print(df.loc["day2"])
calories 380 duration 40 Name: day2, dtype: int64
如果您的数据集存储在文件中,Pandas 可以将它们加载到 DataFrame 中。
将逗号分隔的文件(CSV 文件)加载到 DataFrame 中:
import pandas as pd
df = pd.read_csv('data.csv')
print(df)
亲自试一试 »
您将在接下来的章节中了解有关导入文件的更多信息。
截取页面反馈部分,让我们更快修复内容!也可以直接跳过填写反馈内容!