📚 目录
- Excel 文件支持简介
- 读取 Excel 文件
- 写入 Excel 文件
- 多工作表操作
- Excel 文件参数详解
- 常见问题与解决方案
- 参考资料
- 出站链接
1. Excel 文件支持简介
Pandas 支持直接读取和写入 .xlsx
、.xls
等 Excel 文件格式,依赖第三方库如 openpyxl
、xlrd
、xlsxwriter
。
📦 安装依赖:
pip install openpyxl xlsxwriter
2. 读取 Excel 文件
使用 pd.read_excel()
读取 Excel 文件到 DataFrame:
import pandas as pd
df = pd.read_excel('data.xlsx', engine='openpyxl')
print(df.head())
✅ 指定工作表:
df = pd.read_excel('data.xlsx', sheet_name='Sheet1')
✅ 读取多个表:
dfs = pd.read_excel('data.xlsx', sheet_name=None) # 返回 dict,键为表名,值为 DataFrame
3. 写入 Excel 文件
使用 DataFrame.to_excel()
将数据保存为 Excel 文件:
df.to_excel('output.xlsx', index=False, engine='openpyxl')
4. 多工作表操作
使用 ExcelWriter
写入多个工作表:
with pd.ExcelWriter('multi_sheet.xlsx', engine='xlsxwriter') as writer:
df1.to_excel(writer, sheet_name='Sales')
df2.to_excel(writer, sheet_name='Inventory')
5. Excel 文件参数详解
参数 | 说明 |
---|---|
sheet_name | 指定读取或写入的工作表名 |
header | 指定列名所在行号 |
usecols | 指定读取的列 |
dtype | 指定每列的数据类型 |
na_values | 设置空值标记 |
index | 是否保存 DataFrame 索引列 |
6. 常见问题与解决方案
问题 | 解决方法 |
---|---|
提示缺少 openpyxl | 使用 pip install openpyxl 安装 |
无法读取 .xls 文件 | 指定 engine='xlrd' 并安装 xlrd<2.0.0 |
写入时公式被覆盖 | 使用 xlsxwriter ,并避免写入覆盖含公式区域 |
多次写入表丢失 | 使用 ExcelWriter 并确保 with 语句块中操作完成 |
📖 参考资料
- Pandas 官方 Excel 文档:https://pandas.pydata.org/docs/user_guide/io.html#excel-files
- Python Excel 实战教程(realpython)
- openpyxl 文档:https://openpyxl.readthedocs.io/en/stable/
发表回复