📚 目录

  1. 什么是 DataFrame?
  2. 创建 DataFrame 的方法
  3. DataFrame 的基本属性与操作
  4. 行列访问与切片
  5. 常见实用技巧
  6. 参考资料
  7. 出站链接

1. 什么是 DataFrame?

DataFrame 是 Pandas 中最常用的数据结构,表示一个带行列标签的二维表格。可以理解为“带标签的电子表格”或“SQL 中的表”。

每列可以是不同类型的数据(int、float、str、bool 等),支持强大的数据处理与统计功能。


2. 创建 DataFrame 的方法

✅ 通过字典创建:

import pandas as pd

data = {
    'Name': ['Alice', 'Bob', 'Charlie'],
    'Age': [25, 30, 35],
    'City': ['New York', 'London', 'Paris']
}

df = pd.DataFrame(data)
print(df)

输出:

     Name  Age      City
0   Alice   25  New York
1     Bob   30    London
2  Charlie   35     Paris


✅ 通过二维数组创建:

import numpy as np

data = np.array([[1, 2], [3, 4]])
df = pd.DataFrame(data, columns=['A', 'B'])


✅ 从 CSV 文件创建:

df = pd.read_csv('data.csv')


3. DataFrame 的基本属性与操作

属性/方法说明
df.shape行数与列数
df.columns列名
df.index行索引
df.dtypes各列的数据类型
df.head()查看前几行数据
df.tail()查看后几行数据
df.info()表结构总览
df.describe()数据统计摘要

4. 行列访问与切片

✅ 按列访问:

df['Name']
df.Name  # 当列名无空格时可用此法

✅ 按行访问:

df.loc[0]   # 按标签访问
df.iloc[0]  # 按位置访问

✅ 切片访问:

df.iloc[1:3]            # 第2~3行
df.loc[:, ['Name', 'Age']]  # 所有行,仅显示 Name 和 Age 列


5. 常见实用技巧

  • 添加新列:
df['Score'] = [90, 85, 88]

  • 删除列:
df.drop('City', axis=1, inplace=True)

  • 数据类型转换:
df['Age'] = df['Age'].astype('float')

  • 检查缺失值:
df.isnull().sum()


📖 参考资料


🔗 出站链接