📚 目录
- 什么是 DataFrame?
- 创建 DataFrame 的方法
- DataFrame 的基本属性与操作
- 行列访问与切片
- 常见实用技巧
- 参考资料
- 出站链接
1. 什么是 DataFrame?
DataFrame 是 Pandas 中最常用的数据结构,表示一个带行列标签的二维表格。可以理解为“带标签的电子表格”或“SQL 中的表”。
每列可以是不同类型的数据(int、float、str、bool 等),支持强大的数据处理与统计功能。
2. 创建 DataFrame 的方法
✅ 通过字典创建:
import pandas as pd
data = {
'Name': ['Alice', 'Bob', 'Charlie'],
'Age': [25, 30, 35],
'City': ['New York', 'London', 'Paris']
}
df = pd.DataFrame(data)
print(df)
输出:
Name Age City
0 Alice 25 New York
1 Bob 30 London
2 Charlie 35 Paris
✅ 通过二维数组创建:
import numpy as np
data = np.array([[1, 2], [3, 4]])
df = pd.DataFrame(data, columns=['A', 'B'])
✅ 从 CSV 文件创建:
df = pd.read_csv('data.csv')
3. DataFrame 的基本属性与操作
属性/方法 | 说明 |
---|---|
df.shape | 行数与列数 |
df.columns | 列名 |
df.index | 行索引 |
df.dtypes | 各列的数据类型 |
df.head() | 查看前几行数据 |
df.tail() | 查看后几行数据 |
df.info() | 表结构总览 |
df.describe() | 数据统计摘要 |
4. 行列访问与切片
✅ 按列访问:
df['Name']
df.Name # 当列名无空格时可用此法
✅ 按行访问:
df.loc[0] # 按标签访问
df.iloc[0] # 按位置访问
✅ 切片访问:
df.iloc[1:3] # 第2~3行
df.loc[:, ['Name', 'Age']] # 所有行,仅显示 Name 和 Age 列
5. 常见实用技巧
- 添加新列:
df['Score'] = [90, 85, 88]
- 删除列:
df.drop('City', axis=1, inplace=True)
- 数据类型转换:
df['Age'] = df['Age'].astype('float')
- 检查缺失值:
df.isnull().sum()
📖 参考资料
- 官方文档:https://pandas.pydata.org/docs/user_guide/dsintro.html#dataframe
- 《Python for Data Analysis》第二章
- Real Python DataFrame 教程:https://realpython.com/pandas-dataframe/
发表回复