python的os模块详解

print(os.path.basename(r'D:\临时\python试验\pandas'))图3 os.path.basename注意，若传入的路径为文件，如 r'D:\临时\python试验\pandas\test.txt'，返回的结果是文件名 test.txt。

文章共6,773字 · 阅读需要大约23分钟

一键AI生成摘要，助你高效阅读

问答

流光、月影

10622人浏览 · 2023-04-17 21:28:03

流光、月影 · 2023-04-17 21:28:03 发布

本章介绍python自带模块os，os为操作系统 operating system 的简写，意为python与电脑的交互。主要学习的函数有 os.getcwd()、os.chdir()、os.path.basename()、os.path.join()、os.path.exists()、os.path.isdir()、os.path.isfile()、os.listdir()、os.walk()、os.scandir()、os.stat()、os.mkdir()、os.makedirs()、os.rename()、os.remove()以及获取桌面路径。目录链接有点不准，不够我调多次也调不好，无法手动生成都是自动生成的，将就一下。话不多说，进入正题。

5. os.path.basename()

6. os.path.join()

7. os.path.exists()

8. os.path.isdir() 、 os.path.isfile()

1. 绝对路径、相对路径

概念：绝对路径为一个完整的路径。相对路径为基于当前默认路径下的路径，省去了当前路径的部分。

例子：假如当前默认路径为 D:\临时\python试验\pandas。pandas文件夹下里还有 /merge/first/test.txt 文件夹及文件。那么test.txt文件的路径：

绝对路径	D:\临时\python试验\pandas\merge\first\test.txt
相对路径	\merge\first\test.txt

传授两个快捷技巧获取文件的路径：①在文件夹上方路径处复制路径。②按住shift 右击文件，此时会出现 “复制文件地址” 的选项，点击即可。对于文件，无疑是方法②略胜一筹。

2. 绝对路径的三种表达方式

（1）用单斜杠 / 来分隔文件夹。这是路径是最好表达方式。

如："D: / 临时 / python试验 / pandas"

（2）用双反斜杠 \\ 来分隔文件夹。按照上述的②方法获得的路径都是以单反斜杠 \ 来分隔的，如果手动把 \ 改为 / ，工作量有点大，此时可以选择再加一个反斜杠变为双反斜杠，反斜杠在python中表示的意义是转义符，把具有特殊含义的后者转为不含任何意义的字符（用replace是不行的，因为\在python里表现为转义符，会报错，不信可以试试哈）

如："D: \\ 临时 \\ python试验 \\ pandas"

（3）在路径前加上字母 r ，意思为 raw原始的。字母 r 加在字符串前能确保该字符串全是字符串形式，如 \n也只是 \n，不再翻译为回车换行；\也只是\，不再翻译为转义符。把文件路径复制粘贴后直接在前面加个 r 就行，该方法是最方便的，大推。

如：r"D: \ 临时 \ python试验 \ pandas"

3. os.getcwd()

获取当前文件所在的路径。

import os
print(os.getcwd())

默认状态下，os.getcwd()输出的是当前正在编辑的 ipynb或 py文件所在的路径。

4. os.chdir(path)

更改当前路径，更改后，默认路径为更改后的路径。

os.chdir(r'D:\临时\python试验\pandas')
print(os.getcwd())

更改路径可不是仅仅输出为path那么简单，它对于文件的读取和写入非常方便。

5. os.path.basename(p)

获取路径中的最后一个文件夹名字。

print(os.path.basename(r'D:\临时\python试验\pandas'))

注意，若传入的路径为文件，如 r'D:\临时\python试验\pandas\test.txt'，返回的结果是文件名 test.txt。

6. os.path.join(path, *paths)

拼接路径。

p1 = r'D:\临时\python试验\pandas'
p2 = r'merge\test.txt'
print(os.path.join(p1,p2))

7. os.path.exists(path)

判断路径 path是否存在。

print(os.path.exists(r'D:\临时\python试验\pandas'))
print(os.path.exists(r'D:\临时\python试验\pandas\3D图.csv'))

8. os.path.isdir(path, /) 、 os.path.isfile(path)

前者判断path是否为文件夹，后者判断path是否为文件。

r1 = r'D:\临时\python试验\pandas'
r2 = r'D:\临时\python试验\pandas\merge\test.txt'

print(os.path.isdir(r1))
print(os.path.isfile(r2))

9. os.listdir(path=None)

输出path路径下所有文件及文件夹，返回结果为一个列表。（不遍历下层）

print(os.listdir(r'D:\临时\python试验\pandas'))

当传入指定 path时，输出该路径下的文件及文件夹，如图6，图中蓝色的为文件夹。

当不传入 path时，有两种情况：①若没有设置 os.chdir(path)去指定默认路径，则输出当前代码文件所在目录下的文件及文件夹。②若设置了 os.chdir(path1)，则输出该path1路径下的文件及文件夹。

“ 不遍历嵌套文件夹 ” 意思是：即使merge文件夹下还有文件，那么这个文件也不会得到输出，即仅遍历当前层。（如果想要输出嵌套文件夹下的所有文件，可见下面第9点 os.walk(path) ）

10. os.walk(top, topdown=True, οnerrοr=None, followlinks=False)

循环遍历top路径下的所有文件，该路径下层的文件及文件夹。

top：路径，顶层路径

topdown：可以理解为加快速度，不用管，默认为True

onerror：当有错误时，可以用定义的函数去输出错误

followlinks：默认为False，意义不大

该函数必须传入路径，返回3个变量值。第一个为文件夹绝对路径，第二个为子文件夹的列表，第三个为根目录下所有文件的列表。先看第一个 (i)：

for (i,j,k) in os.walk(r'D:\临时\python试验\pandas'):
    print(i)

i 得到的是该路径下所有文件夹的绝对路径（看图6，该路径下有个merge文件夹）。再看 j ：

for (i,j,k) in os.walk(r'D:\临时\python试验\pandas'):
    print(j)

j 得到的是对应 i 路径下含有的文件夹，每个 i 的路径输出一个列表。['merge']的由来是因为 D:\临时\python试验\pandas下有个merge文件；[]的由来是因为 D:\临时\python试验\pandas\merge下没有文件夹了。再看 k：

for (i,j,k) in os.walk(r'D:\临时\python试验\pandas'):
    print(k)

k 得到的是对应 i 路径下含有的文件，每个 i 的路径输出一个列表。这里输出的两个列表的由来，和 j 一样，就不一一解释了。

由此，通常循环遍历某路径下所有文件以及路径的方法是把 i 和 k 结合：

for (i,j,k) in os.walk(r'D:\临时\python试验\pandas'):
    for l in k:
        print(i+'/'+ l)

此时，位于下层merge文件下的 test.txt 也打印了出来，这是与 os.listdir()即图7的区别。

11. os.scandir(path=None)

加快迭代速度，把需要迭代的内容放在一个迭代对象里，而不是像os.listdir()一样把结果存在列表中（放在列表占用大量内存）

可见返回的是一个可迭代对象，作用是减少内存占用，加快运行速度。除此之外，它还可以访问文件的各种属性。如获取文件/文件夹名，文件/文件夹绝对路径，是否为文件夹，是否为文件，以及属性。

for i in os.scandir(r'D:\临时\python试验\pandas'):
    print(i)
    print(i.name)
    print(i.path)
    print(i.is_dir())
    print(i.is_file())
    print('-'*70)

根据属性，还可以提取文件的大小(单位为kb，文件夹大小为0kb)、最近访问时间、最近修改时间、window系统下的创建时间、linux系统下的创建时间等。这里以文件大小 .st_size为例

文件大小	.st_size
最近访问时间	.st_atime
最近修改时间	.st_mtime
window系统下的创建时间	.st_ctime
linux系统下的创建时间	.st_birthtime

for i in os.scandir(r'D:\临时\python试验\pandas'):
    print(i.name,i.stat().st_size,'kb')

12. os.stat(path, *, dir_fd=None, follow_symlinks=True)

获得文件的属性。能获得的属性与上面一样，不再重复。

a = os.stat(r'D:\临时\python试验\pandas\3D图.csv')
print(a)
print(a.st_size,'kb')

13. os.mkdir(path, mode=511, *, dir_fd=None)

创建路径（文件夹），若该路径已存在，则报错。（只能创建一层）

path：路径

mode：访问权限，默认为511，即所有人都可访问。在window系统下，mode参数会被忽略。

（1）当路径已存在：（目前已存在的路径：D:\临时\python试验\pandas\merge ）

（2）创建两层文件夹：

os.mkdir(r'D:\临时\python试验\pandas\merge\concat\join')

用os.mkdir()去创建两层文件夹（merge → concat）是不允许的，每次只能创建一层。

（3）创建一层文件夹：

14. os.makedirs(name, mode=511, exist_ok=False)

创建路径（文件夹），能一次创建多层。

在运行该代码前，首先要删掉第13中创建的文件夹，回到最初的状态，方便观察效果（即 D:\临时\python试验\pandas\merge 目录下没有文件夹）

os.makedirs(r'D:\临时\python试验\pandas\merge\concat\join')
print('成功')

os.mkdir 一次只能创建一层，而 os.makedirs 一次能创建多层，则就是它们之间的区别。

15. os.rename(src, dst, *, src_dir_fd=None, dst_dir_fd=None)

重命名/移动文件或文件夹。

src：原文件路径

dst：重命名/移动后的文件路径

首先在 D:/临时/python试验/pandas 目录下手动创建3个word文件用于实验：重命名before.docx、移动before.docx、重命名并移动before.docx

（1）重命名

把文件 "重命名before.docx" 重命名为 "重命名after.docx"。

os.rename(r"D:/临时/python试验/pandas/重命名before.docx",r"D:\临时\python试验\pandas\重命名after.docx")

（2）移动

把文件 "移动before.docx" 由 "D:/临时/python试验/pandas" 移动到 "D:\临时" ，不改变命名。

os.rename(r"D:\临时\python试验\pandas\移动before.docx",r"D:\临时\移动before.docx")

（3）重命名并移动

把文件 "重命名并移动before.docx" 由 "D:/临时/python试验/pandas" 移动到 "D:\临时" ，同时命名改为 "重命名并移动after.docx " 。

os.rename(r"D:\临时\python试验\pandas\重命名并移动before.docx",r"D:\临时\变变变.docx")

总的来说，重命名把名字改了就行；移动把路径改了就行；移动并重命名则同时改路径和名字。

如果后路径不存在，会报错 “找不到路径” 。

需要注意的是，改名字的时候小心不要把文件的后缀弄没了，如果真的不小心弄没了后缀，可以点击文件夹的左上角 “查看”，把 “文件拓展名” 勾上，然后手动加上后缀名。要小心避免此类问题。下图为不小心把 .docx后缀弄没了的文件，该文件由于没有后缀，系统不能识别该文件是什么类型。

16. os.remove(path, *, dir_fd=None)

删除文件。小心该操作，不进回收站，删除后是很难找回来的，建议不要用重要的文件去实验。

图20 删除文件os.remove

17. 获取桌面的路径

给大家传授一个不常见但非常有用的东西：获取桌面的路径。

    os.path.expanduser("~")   获取电脑用户名及路径

获取到用户名的路径后，用os.path.join()拼接即可获得桌面路径。

user = os.path.expanduser("~")
desktop = os.path.join(user,'Desktop')
print(user)
print(desktop)

有什么用途呢，幻想一下你写了一个程序把运行出来的结果保存在excel里，想要把这个excel文件保存在对方桌面（为什么保存到桌面，因为缩小化去运行程序，让没有学过编程的朋友看着桌面自动生成了一个excel文件，他们的兴趣马上就来了，那种仰望的眼神，谁懂！！）的时候，就需要获取电脑的桌面路径了，这种方法的缺点是在电脑更改了桌面路径后便不适用。当然，这只是一个小例子，其他用处还有很多，待各位小伙伴发掘，然后分享出来。

结尾

os 模块操作最多的是路径和文件夹，涉及到对文件的文件不多。

如果想要用python模块去批处理文件，对于重命名，移动等，os还是可以做到的。但是更高级的功能，比如文件的复制，剪切，以及使用通配符*去查找符合条件的文件就比较困难了，通常要使用到其他库，如shutil， glob，fnmatch 等库，如果小伙伴对这方面感兴趣，可以提前进行了解。

可能后续我也会更新shutil， glob，fnmatch 等库，但是一篇文章的输出、排版、思考如何才能讲得清楚明白都需要大量时间。把我学到的知识用自己的理解、自己的思维写出来，有输入有输出，同时能锻炼自己的写作、组织、通俗易懂化和其他能力，目前我可能讲的不够条理，但是我也在和大家一起进步，一起加油。

GitCode 开源社区

旨在为数千万中国开发者提供一个无缝且高效的云端环境，以支持学习、使用和贡献开源项目。

更多推荐

【目标检测】目标检测的一些常用神经网络模型及方法

我的阶段性总结????文章目录1.概述1.2 目标检测的任务1.3 目标检测的分类2.R-CNN系列2.1 [R-CNN（Region with CNN features）](https://arxiv.org/pdf/1311.2524.pdf)2.2 [Fast R-CNN](https://www.cv-foundation.org/openaccess/content_iccv_2015/