你是不是也被 Excel 表格折磨得头大?
你是不是也想快速分析数据,却不知道从哪开始?

别担心!今天我给你推荐 Python 数据分析神器——Pandas,让你用代码玩转数据,轻松做出报表、统计和可视化。无论你是数据小白,还是想升级办公技能的高手,这篇文章绝对让你收益满满!


Pandas是什么?为什么人人都在用它?

Pandas 是 Python 世界里处理表格数据的 瑞士军刀
它可以帮你:

  • 轻松读取 CSV、Excel、SQL 数据

  • 快速清洗脏数据(缺失值、重复值…)

  • 高效筛选、排序、统计数据

  • 与 Matplotlib、Seaborn 搭配做可视化

简单来说:有了 Pandas,你就是数据分析高手

安装命令:

pip install pandas

导入方式:

import pandas as pd

1️ 核心数据结构:Series 和 DataFrame

Series:一维数据的超能容器

import pandas as pd
s = pd.Series([10, 20, 30], index=['a','b','c'])
print(s)

输出:

a    10
b    20
c    30

 小技巧:Series 就像带索引的列表,每个元素都有名字,查数据更方便。

DataFrame:二维表格,Excel搬到Python里

data = {
    'Name': ['Alice','Bob','Charlie'],
    'Age': [25,30,35],
    'City': ['Beijing','Shanghai','Guangzhou']
}
df = pd.DataFrame(data)
print(df)

输出:

      Name  Age      City
0    Alice   25   Beijing
1      Bob   30  Shanghai
2  Charlie   35  Guangzhou

 小技巧:DataFrame 就是表格,每列可以不同类型,行列都能灵活索引。


2️ Pandas 基础操作,5分钟上手

查看数据

df.head()   # 前5行
df.tail(3)  # 后3行
df.info()   # 数据类型和缺失值
df.describe() # 数值统计

选取数据

df['Name']           # 一列
df[['Name','Age']]   # 多列
df.loc[0]            # 一行
df.loc[0,'Name']     # 单元格
df.iloc[0,1]         # 数字索引

条件筛选

df[df['Age']>30]  # 年龄大于30
df[(df['Age']>25) & (df['City']=='Shanghai')]

3️ 数据清洗,拒绝脏数据!

处理缺失值

df.isnull()      # 查缺失
df.dropna()      # 删除缺失行
df.fillna(0)     # 填充

删除重复值

df.drop_duplicates()

 数据干净,分析才能准确!这是数据分析的第一步。


4️ 数据统计和分析,3行代码搞定

df['Age'].mean()      # 平均年龄
df['Age'].max()       # 最大年龄
df['City'].value_counts() # 城市出现次数

分组操作

df.groupby('City')['Age'].mean()

 想按城市计算平均年龄?Pandas 一行搞定!


5️ 高级操作,Pandas让你更强大

  • 合并数据

df1 = pd.DataFrame({'ID':[1,2],'Name':['Alice','Bob']})
df2 = pd.DataFrame({'ID':[1,2],'Score':[90,80]})
df_merged = pd.merge(df1, df2, on='ID')
  • 透视表

pd.pivot_table(df, index='City', values='Age', aggfunc='mean')
  • 应用函数

df['Age_plus_5'] = df['Age'].apply(lambda x:x+5)

 总结

掌握 Pandas,你就能:

  • 快速读取和整理数据

  • 高效分析数据趋势

  • 做出漂亮的报表和图表

数据分析不再是难题,Python + Pandas,让你3分钟搞定Excel都做不到的事!

更多推荐