Python 数据分析必备神器!带你轻松掌握 Pandas,从零到大师!
·
你是不是也被 Excel 表格折磨得头大?
你是不是也想快速分析数据,却不知道从哪开始?
别担心!今天我给你推荐 Python 数据分析神器——Pandas,让你用代码玩转数据,轻松做出报表、统计和可视化。无论你是数据小白,还是想升级办公技能的高手,这篇文章绝对让你收益满满!
Pandas是什么?为什么人人都在用它?
Pandas 是 Python 世界里处理表格数据的 瑞士军刀。
它可以帮你:
-
轻松读取 CSV、Excel、SQL 数据
-
快速清洗脏数据(缺失值、重复值…)
-
高效筛选、排序、统计数据
-
与 Matplotlib、Seaborn 搭配做可视化
简单来说:有了 Pandas,你就是数据分析高手。
安装命令:
pip install pandas
导入方式:
import pandas as pd
1️ 核心数据结构:Series 和 DataFrame
Series:一维数据的超能容器
import pandas as pd
s = pd.Series([10, 20, 30], index=['a','b','c'])
print(s)
输出:
a 10
b 20
c 30
小技巧:Series 就像带索引的列表,每个元素都有名字,查数据更方便。
DataFrame:二维表格,Excel搬到Python里
data = {
'Name': ['Alice','Bob','Charlie'],
'Age': [25,30,35],
'City': ['Beijing','Shanghai','Guangzhou']
}
df = pd.DataFrame(data)
print(df)
输出:
Name Age City
0 Alice 25 Beijing
1 Bob 30 Shanghai
2 Charlie 35 Guangzhou
小技巧:DataFrame 就是表格,每列可以不同类型,行列都能灵活索引。
2️ Pandas 基础操作,5分钟上手
查看数据
df.head() # 前5行
df.tail(3) # 后3行
df.info() # 数据类型和缺失值
df.describe() # 数值统计
选取数据
df['Name'] # 一列
df[['Name','Age']] # 多列
df.loc[0] # 一行
df.loc[0,'Name'] # 单元格
df.iloc[0,1] # 数字索引
条件筛选
df[df['Age']>30] # 年龄大于30
df[(df['Age']>25) & (df['City']=='Shanghai')]
3️ 数据清洗,拒绝脏数据!
处理缺失值
df.isnull() # 查缺失
df.dropna() # 删除缺失行
df.fillna(0) # 填充
删除重复值
df.drop_duplicates()
数据干净,分析才能准确!这是数据分析的第一步。
4️ 数据统计和分析,3行代码搞定
df['Age'].mean() # 平均年龄
df['Age'].max() # 最大年龄
df['City'].value_counts() # 城市出现次数
分组操作
df.groupby('City')['Age'].mean()
想按城市计算平均年龄?Pandas 一行搞定!
5️ 高级操作,Pandas让你更强大
-
合并数据
df1 = pd.DataFrame({'ID':[1,2],'Name':['Alice','Bob']})
df2 = pd.DataFrame({'ID':[1,2],'Score':[90,80]})
df_merged = pd.merge(df1, df2, on='ID')
-
透视表
pd.pivot_table(df, index='City', values='Age', aggfunc='mean')
-
应用函数
df['Age_plus_5'] = df['Age'].apply(lambda x:x+5)
总结
掌握 Pandas,你就能:
-
快速读取和整理数据
-
高效分析数据趋势
-
做出漂亮的报表和图表
数据分析不再是难题,Python + Pandas,让你3分钟搞定Excel都做不到的事!
更多推荐
所有评论(0)