前言

python csv数据读取-转换-保存:
参考:https://blog.csdn.net/bryanwang_3099/article/details/119731390

https://www.jb51.net/article/217415.htm
这个较为详细 许多小操作都有详尽记载


一、csv文件

CSV是一种以逗号分隔数值的文件类型,在数据库或电子表格中,常见的导入导出文件格式就是CSV格式,CSV格式存储数据通常以纯文本的方式存数数据表。
csv 库中有4个常用的对象:

csv.reader:以列表的形式返回读取的数据。
csv.writer:以列表的形式写入数据。
csv.DictReader:以字典的形式返回读取的数据。
csv.DictWriter:以字典的形式写入数据。

csv形状如下所示:上面为表头 下面为数据

在这里插入图片描述

二、两种python 读取csv方式

1.csv库

代码如下(示例):

import csv
csv_reader = csv.reader(open("data.csv"))
for row in csv_reader:
	print(row)

注意 这里读取的为每一行

2.pandas

代码如下(示例):

import pandas as pd
df = pd.read_csv("data.csv",encoding="utf-8")
print(df)

该处df为结构体 DataFrame(x,y)。
如 data.csv 文件中 有多个表头,多列。
写入的时候提取出的 DataFrame 需要转为列表
两者是可以相互转换的

如 tolist()等是十分好用的。

import pandas as pd
df = pd.read_csv("data.csv",encoding="utf-8")
df_array = np.array(df)#将pandas读取的数据转化为array
df_list = data_array.tolist()#将数组转化为list

三、读取csv文件某列、某行

1.读取某几列

import pandas as pd
path = 'data.csv'
data = pd.read_csv(path) 
#data为结构体
#读取某两列
x = data[['top', 'left']]
print(x)
#读取某一列
y = data[['top']]
print(y)

实际上如果只读取一列数据
可以通过 data[i] 来读取

2.读取某行

import csv
csv_reader = csv.reader(open("data.csv"))
i= 0
for row in csv_reader:
	if i % 2 == 0print(row)

读取某几行 如第一行 第二行和第四行的所有数据

import pandas as pd
path = 'data.csv'
data = pd.read_csv(path) 
print(data.ix[[0,1,3],:])

四、csv写入方式

# 1. 创建文件对象(指定文件名,模式,编码方式)a模式 为 下次写入在这次的下一行
with open("file.csv", "a", encoding="utf-8", newline="") as f:
    # 2. 基于文件对象构建 csv写入对象
    csv_writer = csv.writer(f)
    # 3. 构建列表头
    name=['top','left']
    csv_writer.writerow(name)
    # 4. 写入csv文件内容
    z = [
    [0, 31],
    [1, 30],
    [2, 32]
    ]
    csv_writer.writerow(z)
    print("写入数据成功")
    # 5. 关闭文件
    f.close()

关于写入,需要注意:
当然可以以便读取文件,一边写入。

在打开文件时,需要添加newline = “”。否则,会在每2行有效内容之间添加一行空白。
如果要保存的内容有中文,而且之后需要用Excel打开文件,那么需要选用utf-8-sig编码。如果使用utf-8编码,会导致使用Excel查看文件时中文乱码。


总结

数据会有很多问题,主要是要看数据类型,调试的时候看清楚

Logo

旨在为数千万中国开发者提供一个无缝且高效的云端环境,以支持学习、使用和贡献开源项目。

更多推荐