pandas操作1（读csv不要索引/写csv不要索引/删除有空值行/按时间排序）

pandas常用csv操作读csv不要索引（index）写csv不要索引删除有空值的行按时间排序读csv不要索引（index）在使用pandas读csv（read_csv())时，会默认产生一列索引，当你要把处理过后的csv文件生成一个新的csv文件时，就会多出一列索引值且这一列没有名字，不方便通过drop(columns=[‘name’])来删除，可以一开始在读的时候就让它不要产生索引(inde

kanchigo

26162人浏览 · 2021-06-06 22:59:01

kanchigo · 2021-06-06 22:59:01 发布

读csv不要索引（index）

在使用pandas读csv（read_csv())时，会默认产生一列索引，当你要把处理过后的csv文件生成一个新的csv文件时，就会多出一列索引值且这一列没有名字，不方便通过drop(columns=[‘name’])来删除，可以一开始在读的时候就让它不要产生索引(index_col=0)。

df = pd.read_csv('filename.csv', encoding='utf-8', index_col=0)

写csv不要索引

同样在生成csv文件时（to_scv()）也可以避免生成索引列，方法为添加参数（index=False）

df.to_csv('C:/filepath/xxx.csv', index=False)

删除有空值的行

做数据分析的时候遇到有的行的某个关键值为空，那最好删除掉一整行以免影响后面的操作。

df1 = df.dropna(subset=['列名'])

按时间排序

有的数据可能是与时间先后顺序有关，需要按照时间先后顺序排序，这时候需要先把带有时间的列转为date_time格式，再进行排序。

df1['time'] = pd.to_datetime(df1['time'])
df1.sort_values('time', inplace=True)

inplace代表是否更改数据，默认是False，要保存结果的话需要inplace=True。

其他操作

pandas操作2（增加列并赋值/两列时间相减/按时间合并且求和）

pandas操作3（插入列insert/统计出现次数value_counts）

pandas操作4（处理缺失值，位置索引）

华为云开发者联盟

为开发者提供学习成长、分享交流、生态实践、资源工具等服务，帮助开发者快速成长。

更多推荐

通过HPA+CronHPA组合应对业务复杂弹性伸缩场景

华为云开发者联盟

FT-FMEA融合混沌演练，零售运营系统韧性架构在线验证实践

华为云开发者联盟

如何使用Python和Plotly绘制3D图形

华为云开发者联盟

所有评论(0)

查看更多评论

kanchigo

@kanchigo

已为社区贡献1条内容