2024年11月26日 Python51
统计文件个数
我们可以使用.iterdir方法获取当前文件下的所以文件.
import pathlib from collections import Counter now_path = pathlib.Path.cwd() gen = (i.suffix for i in now_path.iterdir()) print(Counter(gen))
输出内容
Counter({'.py': 16, '': 11, '.txt': 1, '.png': 1, '.csv': 1})
通过配合使用collections模块的Counter方法,我们获取了当文件夹下文件类型情况。
前面我们说过glob模块点这里了解【glob模块的使用】,同样的pathlib也有glob方法和rglob方法,不同的是glob模块里的glob方法结果是列表形式的,iglob是生成器类型,在这里pathlib的glob模块返回的是生成器类型,然后pathlib还有一个支持递归操作的rglob方法。
下面的这个操作我通过使用glob方法,设定规则进行文件的匹配。
import pathlib from collections import Counter gen =(p.suffix for p in pathlib.Path.cwd().glob('*.py')) print(Counter(gen))
展示目录树
下一个示例定义了一个函数tree(),该函数的作用是打印一个表示文件层次结构的可视树,该树以一个给定目录为根。因为想列出其子目录,所以我们要使用.rglob()方法:
import pathlib from collections import Counter def tree(directory): print(f'+ {directory}') for path in sorted(directory.rglob('*')): depth = len(path.relative_to(directory).parts) spacer = ' ' * depth print(f'{spacer}+ {path.name}') now_path = pathlib.Path.cwd() if __name__ == '__main__': tree(now_path)
其中relative_to的方法的作用是返回path相对于directory的路径。
parts方法可以返回路径的各部分。例如
import pathlib now_path = pathlib.Path.cwd() if __name__ == '__main__': print(now_path.parts)
返回
('/', 'Users', 'chennan', 'pythonproject', 'demo')
获取文件最后一次修改时间
iterdir(),.glob()和.rglob()方法非常适合于生成器表达式和列表理解。
使用stat()方法可以获取文件的一些基本信息,使用.stat().st_mtime可以获取文件最后一次修改的信息。
import pathlib now_path = pathlib.Path.cwd() from datetime import datetime time, file_path = max((f.stat().st_mtime, f) for f in now_path.iterdir()) print(datetime.fromtimestamp(time), file_path)
甚至可以使用类似的表达式获取上次修改的文件内容
import pathlib from datetime import datetime now_path =pathlib.Path.cwd() result = max((f.stat().st_mtime, f) for f in now_path.iterdir())[1] print(result.read_text())
.stat().st_mtime会返回文件的时间戳,可以使用datetime或者time模块对时间格式进行进一步转换。
其他内容
关于pathlib.Path格式路径转换为字符串类型。
因为通过pathlib模块操作生成的路径,不能直接应用字符串的一些操作,所以需要转换成字符串,虽然可以使用str()函数进行转换,但是安全性不高,建议使用os.fspath()方法,因为如果路径格式非法的,可以抛出一个异常。str()就不能做到这一点。
拼接符号"/"背后的秘密
/运算符由__truediv__()方法定义。 实际上,如果你看一下pathlib的源代码,你会看到类似的东西。
class PurePath(object): def __truediv__(self, key): return self._make_child((key,))
本文链接:http://so.lmcjl.com/news/18508/