Python酷库之旅-第三方库Pandas(051)
Pandas 是 Python 数据分析生态系统中最为基础和强大的库之一。它提供了高性能、易于使用的数据结构和数据分析工具,让数据处理变得更加高效和直观。
import pandas as pd
# 读取CSV文件
df = pd.read_csv('data.csv')
# 读取Excel文件
df = pd.read_excel('data.xlsx')
# 查看前五行数据
print(df.head())
# 查看数据基本信息
print(df.info())
# 查看统计描述
print(df.describe())
# 筛选年龄大于30岁的用户
df[df['age'] > 30]
# 按性别分组,计算每个性别的平均年龄
df.groupby('gender')['age'].mean()
# 删除缺失值
df.dropna()
# 填充缺失值
df.fillna(0)
# 重命名列
df.rename(columns={'old_name': 'new_name'}, inplace=True)
import matplotlib.pyplot as plt
# 绘制柱状图
df.plot(kind='bar')
plt.show()
Pandas 是数据科学家和数据分析师必备的工具之一。它提供了一套高效、灵活的数据分析工具,使得数据处理变得更加简单。通过本文的介绍,相信你对Pandas有了初步的了解。
想进一步深入学习Pandas吗? 您可以提出以下问题:
期待您的提问!