Python酷库之旅-第三方库Pandas(115)
Pandas 是 Python 生态系统中用于数据分析和处理的强大工具。它提供了一组高性能、易于使用的数据结构和数据分析工具,使得我们可以高效地处理各种类型的数据,从简单的 CSV 文件到复杂的时间序列数据。
import pandas as pd
# 读取CSV文件
df = pd.read_csv('data.csv')
# 读取Excel文件
df = pd.read_excel('data.xlsx')
# 查看前五行数据
print(df.head())
# 查看数据基本信息
print(df.info())
# 查看描述性统计
print(df.describe())
# 筛选年龄大于30的人
df[df['Age'] > 30]
# 筛选城市为'北京'的人
df[df['City'] == '北京']
# 添加新列
df['new_column'] = df['Age'] * 2
# 删除列
df.drop('column_name', axis=1, inplace=True)
# 按城市分组,计算每个城市的平均年龄
df.groupby('City')['Age'].mean()
import matplotlib.pyplot as plt
df.plot(kind='bar')
plt.show()
Pandas 是 Python 数据分析领域不可或缺的工具。通过本文的介绍,你应该对 Pandas 有了一个基本的了解。在实际应用中,你可以通过不断地学习和实践,掌握 Pandas 的更多高级功能,从而更高效地处理数据。
希望本文能帮助你更好地理解和使用 Pandas!
如果你有任何问题,欢迎随时提问。
以下是一些可以进一步探讨的问题:
让我们一起探索 Pandas 的更多可能性!