pathlib的使用例子

2024年11月26日 Python51

统计文件个数

我们可以使用.iterdir方法获取当前文件下的所以文件.

import pathlib
from collections import Counter
now_path = pathlib.Path.cwd()
gen = (i.suffix for i in now_path.iterdir())
print(Counter(gen))

输出内容

Counter({'.py': 16, '': 11, '.txt': 1, '.png': 1, '.csv': 1})

通过配合使用collections模块的Counter方法,我们获取了当文件夹下文件类型情况。

前面我们说过glob模块点这里了解【glob模块的使用】,同样的pathlib也有glob方法和rglob方法,不同的是glob模块里的glob方法结果是列表形式的,iglob是生成器类型,在这里pathlib的glob模块返回的是生成器类型,然后pathlib还有一个支持递归操作的rglob方法。

下面的这个操作我通过使用glob方法,设定规则进行文件的匹配。

import pathlib
from  collections import Counter
gen =(p.suffix for p in pathlib.Path.cwd().glob('*.py'))
print(Counter(gen))

展示目录树

下一个示例定义了一个函数tree(),该函数的作用是打印一个表示文件层次结构的可视树,该树以一个给定目录为根。因为想列出其子目录,所以我们要使用.rglob()方法:

import pathlib
from  collections import Counter
def tree(directory):
    print(f'+ {directory}')
    for path in sorted(directory.rglob('*')):
        depth = len(path.relative_to(directory).parts)
        spacer = '    ' * depth
        print(f'{spacer}+ {path.name}')

now_path = pathlib.Path.cwd()

if __name__ == '__main__':
    tree(now_path)

其中relative_to的方法的作用是返回path相对于directory的路径。

parts方法可以返回路径的各部分。例如

import pathlib
now_path = pathlib.Path.cwd()
if __name__ == '__main__':
    print(now_path.parts)

返回

('/', 'Users', 'chennan', 'pythonproject', 'demo')

获取文件最后一次修改时间

iterdir(),.glob()和.rglob()方法非常适合于生成器表达式和列表理解。

使用stat()方法可以获取文件的一些基本信息,使用.stat().st_mtime可以获取文件最后一次修改的信息。

import pathlib
now_path = pathlib.Path.cwd()
from datetime import datetime
time, file_path = max((f.stat().st_mtime, f) for f in now_path.iterdir())
print(datetime.fromtimestamp(time), file_path)

甚至可以使用类似的表达式获取上次修改的文件内容

import pathlib
from datetime import datetime
now_path =pathlib.Path.cwd()
result = max((f.stat().st_mtime, f) for f in now_path.iterdir())[1]
print(result.read_text())

.stat().st_mtime会返回文件的时间戳,可以使用datetime或者time模块对时间格式进行进一步转换。

其他内容

关于pathlib.Path格式路径转换为字符串类型。

因为通过pathlib模块操作生成的路径,不能直接应用字符串的一些操作,所以需要转换成字符串,虽然可以使用str()函数进行转换,但是安全性不高,建议使用os.fspath()方法,因为如果路径格式非法的,可以抛出一个异常。str()就不能做到这一点。

拼接符号"/"背后的秘密

/运算符由__truediv__()方法定义。 实际上,如果你看一下pathlib的源代码,你会看到类似的东西。

class PurePath(object):

    def __truediv__(self, key):
        return self._make_child((key,))

本文链接:http://so.lmcjl.com/news/18508/

展开阅读全文