编程的一个小麻烦之一是:Microsoft Windows在文件夹名称之间使用反斜杠字符,而几乎所有其他计算机都使用正斜杠:
1 2 3 4 5 6 |
Windows filenames: C:\some_folder\some_file.txt Most other operating systems: /some_folder/some_file.txt |
这是一个意外--1980年早期的计算机历史记录。MS-DOS的第一个版本使用正斜杠字符来指定命令行选项。当Microsoft在MS-DOS 2.0中添加对文件夹的支持时,正斜杠字符已被采用,因此它们使用反斜杠。三十五年后,我们仍然陷于这种不相容的窘境。
如果你希望你的Python代码可以在Windows和Mac / Linux上工作,你需要处理这些特定于平台的问题。幸运的是,Python 3有一个名为pathlib
的新模块,它能很愉悦地处理文件兼容问题。
让我们快速浏览一下处理文件名路径的不同方法,就会发现pathlib
如何让你的生活更美好!
错误的解决方案:手动建立文件路径
假设您有一个数据文件夹,其中包含Python程序,并想用程序打开的文件夹: 在Python中,这样编码是错误方式:
1 2 3 4 5 |
data_folder = "source_data/text_files/" file_to_open = data_folder + "raw_data.txt" f = open(file_to_open) print(f.read()) |
请注意,我在Mac上使用Unix风格的正斜杠对路径进行了硬编码。这会让Windows用户很生气。
技术上讲,该代码在Windows上仍将工作,因为Python有一个黑技术,当在Windows上使用open()
函数,无论是哪种斜线的Python都会识别。但即使如此,你也不应该依赖这一点。如果在错误的操作系统上使用错误类型的斜线,并不是所有的Python库都可以正常工作—— 特别是当它们与外部程序或库连接时。
而Python对混合斜线类型的支持是仅适用于Windows操作系统的黑技术,在其他操作系统它不能正常工作。在Mac中使用反斜杠,代码中的将会报错。
出于这些原因,使用硬编码路径字符串编写代码会使其他程序员傻瓜一样看你。一般来说,你应该尽量避免它。
旧解决方案:Python的os.path模块
Python的os.path模块有很多工具用于解决这些特定于操作系统的文件系统问题。
您可以使用os.path.join()为当前操作系统使用正确类型的斜杠构建路径:
1 2 3 4 5 6 |
import os.path data_folder = os.path.join("source_data", "text_files") file_to_open = os.path.join(data_folder, "raw_data.txt") f = open(file_to_open) print(f.read()) |
这段代码可以在Windows或Mac上完美工作。问题是这是一个痛苦的使用。写出os.path.join()
并将路径的每个部分作为一个单独的字符串传递是很罗嗦的,也是不直观的。
由于os.path模块中的大部分函数都是类似的恼人的使用,开发人员通常会忘记使用它们,即使他们知道使用这些会更好。这导致了很多跨平台的bug和愤怒的用户。
更好的解决方案:Python 3的pathlib!
Python 3.4引入了一个新的标准库,用于处理文件和路径称为pathlib的。 这真是太棒了!
要使用它,只需使用正斜杠将路径或文件名传递到新的Path()
对象中,然后Path()
会处理剩下的部分:
1 2 3 4 5 6 |
from pathlib import Path data_folder = Path("source_data/text_files/") file_to_open = data_folder / "raw_data.txt" f = open(file_to_open) print(f.read()) |
这里需要注意两点:
- 你应该在pathlib函数中使用正斜杠。
Path()
对象为当前的操作系统将正斜杠转换成正确的斜线。太好了! - 如果要添加到路径中,可以直接在代码中使用
/
运算符。告别重复输入os.path.join(a,b)
。
如果这就是所有pathlib所做的,那么这对Python来说将是一个很好的补充 - 但它还有更多的功能!
例如,我们可以读取文本文件的内容,而不必打开和关闭文件:
1 2 3 4 5 |
from pathlib import Path data_folder = Path("source_data/text_files/") file_to_open = data_folder / "raw_data.txt" print(file_to_open.read_text()) |
实际上,pathlib使得大多数标准的文件操作变得简单快捷:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 |
from pathlib import Path filename = Path("source_data/text_files/raw_data.txt") print(filename.name) print(filename.suffix) print(filename.stem) if not filename.exists(): print("Oops, file doesn't exist!") else: print("Yay, the file exists!") |
你甚至可以使用pathlib将Unix路径显式转换成Windows格式的路径:
1 2 3 4 5 6 |
from pathlib import Path, PureWindowsPath filename = Path("source_data/text_files/raw_data.txt") path_on_windows = PureWindowsPath(filename) print(path_on_windows) |
如果你真的想安全地在你的代码中使用反斜杠,你可以声明你的路径为Windows格式,并且pathlib可以为当前操作系统将它转换正确的格式:
1 2 3 4 5 6 7 |
from pathlib import Path, PureWindowsPath filename = PureWindowsPath("source_data\\text_files\\raw_data.txt") correct_path = Path(filename) print(correct_path) |
如果你想要的话,你甚至可以使用pathlib来完成解析相关文件路径,解析网络共享路径以及生成file://
urls。下面是一个例子,它用两行代码,使你在Web浏览器中打开一个本地文件:
1 2 3 4 5 |
from pathlib import Path import webbrowser filename = Path("source_data/text_files/raw_data.txt") webbrowser.open(filename.absolute().as_uri()) |
这只是pathlib的一个小高峰。它可以替代许多不同的文件相关的功能,这些功能曾经分散在不同的Python模块中。
查看更多关于pathlib的使用

