如何在 Python 中解析 CSV 文件
CSV 文件经常用于将表格数据存储到文件中。我们可以轻松地将数据从数据库表或 excel 文件导出到 CSV 文件。它也很容易被人类以及在程序中阅读。在本教程中,我们将学习如何在 Python 中解析 CSV 文件。 什么是解析? 解析文件意味着从文件中读取数据。该文件可能包含文本数据,即所谓的文本文件,或者它们可能是电子表格。 什么是 CSV 文件? CSV 代表逗号分隔文件,即数据使用逗号分隔
CSV 文件经常用于将表格数据存储到文件中。我们可以轻松地将数据从数据库表或 excel 文件导出到 CSV 文件。它也很容易被人类以及在程序中阅读。在本教程中,我们将学习如何在 Python 中解析 CSV 文件。
什么是解析?
解析文件意味着从文件中读取数据。该文件可能包含文本数据,即所谓的文本文件,或者它们可能是电子表格。
什么是 CSV 文件?
CSV 代表逗号分隔文件,即数据使用逗号分隔。 CSV 文件由处理大量数据的程序创建。 CSV 文件中的数据可以很容易地以电子表格和数据库的形式导出,也可以导入以供其他程序使用。让我们看看如何解析 CSV 文件。在 Python 中解析 CSV 文件非常容易。 Python 有一个内置的 CSV 库,它提供从 CSV 文件读取和写入数据的功能。库中有多种格式可用于 CSV 文件,这使得数据处理用户友好。
在 Python 中解析 CSV 文件
使用内置的 Python CSV 模块读取 CSV 文件。
import csv
with open('university_records.csv', 'r') as csv_file:
reader = csv.reader(csv_file)
for row in reader:
print(row)
输出:
Python 解析 CSV 文件
用 Python 编写 CSV 文件
要写入文件,我们必须以写入模式或附加模式打开它。在这里,我们将数据附加到现有的 CSV 文件中。
import csv
row = ['David', 'MCE', '3', '7.8']
row1 = ['Lisa', 'PIE', '3', '9.1']
row2 = ['Raymond', 'ECE', '2', '8.5']
with open('university_records.csv', 'a') as csv_file:
writer = csv.writer(csv_file)
writer.writerow(row)
writer.writerow(row1)
writer.writerow(row2)
Python 追加到 CSV 文件
使用 Pandas 库解析 CSV 文件
还有另一种处理 CSV 文件的方法,这是最流行和更专业的,那就是使用pandas库。 Pandas 是一个 Python 数据分析库。它提供了不同的结构、工具和操作来处理和操作给定的数据,这些数据主要是二维或一维表。
pandas库的用途和特点
-
数据集旋转和重塑。
-
使用 DataFrame 对象进行索引的数据操作。
-
数据过滤。
-
对数据集的合并和连接操作。
-
海量数据集的切片、索引和子集。
-
缺少数据处理和数据对齐。
-
行/列插入和删除。
-
一维不同的文件格式。
-
各种文件格式数据的读写工具。
要使用 CSV 文件,您需要安装 pandas。安装 pandas 非常简单,按照下面的说明使用 PIP 安装它。
$ pip install pandas
Python 安装 Pandas[/caption] [caption idu003d“attachment_30145” alignu003d“aligncenter” widthu003d“727”]
安装完成后,您就可以开始了。
使用 Pandas 模块读取 CSV 文件
在使用 pandas 导入 CSV 文件数据之前,您需要知道数据文件在文件系统中的路径以及当前工作目录是什么。我建议将您的代码和数据文件保存在同一目录或文件夹中,这样您就无需指定路径,从而节省您的时间和空间。
import pandas
result = pandas.read_csv('ign.csv')
print(result)
输出
使用 pandas 模块读取 CSV 文件
使用 Pandas 模块编写 CSV 文件
使用 pandas 编写 CSV 文件就像阅读一样简单。唯一使用的新术语是DataFrame
。 Pandas DataFrame 是一种二维、异构的表格数据结构(数据以表格方式排列在行和列中。Pandas DataFrame 由三个主要组件组成 - 数据、列和行 - 带有标记的 x 轴和 y 轴(行和列)。
from pandas import DataFrame
C = {'Programming language': ['Python', 'Java', 'C++'],
'Designed by': ['Guido van Rossum', 'James Gosling', 'Bjarne Stroustrup'],
'Appeared': ['1991', '1995', '1985'],
'Extension': ['.py', '.java', '.cpp'],
}
df = DataFrame(C, columns=['Programming language', 'Designed by', 'Appeared', 'Extension'])
export_csv = df.to_csv(r'program_lang.csv', index=None, header=True)
输出
Python Pandas 写入 CSV 文件
结论
我们学会了使用内置的 CSV 模块和 pandas 模块来解析 CSV 文件。解析文件有许多不同的方法,但程序员并未广泛使用它们。 PlyPlus、PLY 和 ANTLR 等库是一些用于解析文本数据的库。现在您知道如何使用内置的 CSV 库和强大的 pandas 模块来读取和写入 CSV 格式的数据。上面显示的代码非常基本和简单。熟悉python的人都可以理解,所以我认为不需要解释。然而,对具有空的和模棱两可的数据输入的复杂数据的操作并不容易。它需要对 pandas 中各种工具的实践和知识。 CSV 是保存和共享数据的最佳方式。 Pandas 是 CSV 模块的绝佳替代品。稍加练习,你就会掌握它。一开始你可能会觉得很困难,但学起来并不难。
更多推荐
所有评论(0)