vs2013网站建设,网站负责人照片,wordpress menu icon,嘉兴学网站建设对于文件和目录的处理#xff0c;虽然可以通过操作系统命令来完成#xff0c;但是Python语言为了便于开发人员以编程的方式处理相关工作#xff0c;提供了许多处理文件和目录的内置函数。重要的是#xff0c;这些函数无论是在Unix、Windows还是Macintosh平台上#xff0c;…对于文件和目录的处理虽然可以通过操作系统命令来完成但是Python语言为了便于开发人员以编程的方式处理相关工作提供了许多处理文件和目录的内置函数。重要的是这些函数无论是在Unix、Windows还是Macintosh平台上它们的使用方式是完全一致的。本文将详细解释这些函数的使用方法。首先我们介绍Python语言中类似于Windows系统的dir命令的列出文件功能然后描述如何测试一个文件 名对应的是一个标准文件、目录还是链接以及提取文件大小和日期的方法。之后我们还将介绍如何删除文件和目录如何复制和删除文件以及怎样将一个完整 的文件路径分解成目录部分和文件名部分最后我们讲解目录的创建以及如何在目录树中移动目录并处理文件。一、显示目录内容当我们想要列出当前目录中所有扩展名为.jpg或.gif的文件的时候就可以使用glob模块来完成此项任务如下所示import glob
filelist glob.glob(’*.jpg’) glob.glob(’*.gif’)
上述代码使用了glob函数该函数的参数为要显示的文件类型。在这里文件类型是通过类似UNIX操作系统shell风格通配符描述的一些文件名来指定的。这些通配符的使用方法具体请参考fnmatch模块的文档那里有具体的说明和示例。为了显示一个目录中的全部文件可以使用如下所示的os.listdir函数files os.listdir(r’C:scriptingsrcpyintro’) #适用于 Windows
files os.listdir(’/home/scripting/src/py/intro’) # 适用于Unix# 跨平台版本:
files os.listdir(os.path.join(os.environ[’scripting’],’src’, ’py’, ’intro’))
files os.listdir(os.curdir) # 当前目录中的所有文件
files glob.glob(’*’) glob.glob(’.*’)
二、测试文件类型我们知道文件名、目录名和链接名都是用一个字符串作为其标识符的但是给我们一个标识符我们该如何确定它所指的到底是常规文件文件名、目录名还是链 接名呢?这时我们可以使用os.path模块提供的isfile函数、isdir函数和islink函数来达成我们的目标如下所示if os.path.isfile(myfile):print(plain file)if os.path.isdir(myfile):print(directory)if os.path.islink(myfile):print(link)
你还可以查找文件的日期及其大小time_of_last_access os.path.getatime(myfile)
time_of_last_modification os.path.getmtime(myfile)
size os.path.getsize(myfile) # 这里的时间以秒为单位并且从1970年1月1日开始算起。
为了获取以天为单位的最后访问日期可以使用下列代码import time # time.time()返回当前时间
age_in_days (time.time()-time_of_last_access)/(60*60*24)
为了获取文件的详细信息可以使用os.stat函数和stat模块中的其它实用程序来达到目的如下import statmyfile_stat os.stat(myfile)
size myfile_stat[stat.ST_SIZE]
mode myfile_stat[stat.ST_MODE]if stat.S_ISREG(mode):print(%(myfile)是一个常规文件大小为 %(size)d 字节 %vars())
有关stat模块的详细信息请参见Python Library Reference。若想测试一个文件的读、写以及执行权限可以用os.access函数具体如下所示if os.access(myfile, os.W_OK):print(myfile, 具有写权限)if os.access(myfile, os.R_OK | os.W_OK | os.X_OK):print(myfile, 具有读、写以及执行权限)
像上面这样的测试代码对CGI脚本来说非常有用。三、文件和目录的删除若要删除单个文件的话可以使用os.remove函数例如os.remove(’mydata.dat’)。Os.remove的别名是 os.unlink不过后者跟传统的UNIX操作系统以及Perl中清除文件的函数重名。我们可以使用下列方式来删除一组文件如所有以.jpg以 及*.gif为扩展名的文件for file in glob.glob(’*.jpg’) glob.glob(’*.gif’):os.remove(file)
大家知道只有当目录中内容已经被清空的时候我们才可以使用rmdir命令来删除该目录。不过我们经常想要删除一个含有许多文件的目录树这时我们可以使用shutil模块提供的rmtree函数如下所示shutil.rmtree(’mydir’)
它相当于UNIX操作系统中的命令rm -rf mydir。我们可以建立一个自定义函数使其在进行删除操作的时候将文件和目录做同等对待其典型用法如下所示remove(’my.dat’) #删除当个文件my.dat
remove(’mytree’) #删除单个目录树 mytree# 通过字符串列表中的名称来删除多个文件/目录树
remove(glob.glob(’*.tmp’) glob.glob(’*.temp’))
remove([’my.dat’,’mydir’,’yourdir’] glob.glob(’*.data’))# 下面是remove函数的实现
def remove(files):删除一个或多个文件和/或目录。if isinstance(files, str): # files是个字符串吗?files [files] # 把files从字符串转为列表if not isinstance(files, list): # files不是列表吗?for file in files:if os.path.isdir(file):shutil.rmtree(file)elif os.path.isfile(file):os.remove(file)
下面测试一下remove函数的灵活性 #建立10个目录tmp_* 以及10个文件tmp__*for i in range(10):os.mkdir(’tmp_’str(i))f open(’tmp__’str(i), ’w’);
f.close()
remove(’tmp_1’) # tmp_1为目录
remove(glob.glob(’tmp_[0-9]’) glob.glob(’tmp__[0-9]’))
四、文件的复制与重命名当我们要复制文件的时候可以使用shutil模块import shutil
shutil.copy(myfile, tmpfile)
#拷贝最后访问时间和最后修改时间
shutil.copy2(myfile, tmpfile)# 拷贝一个目录树
shutil.copytree(root_of_tree, destination_dir, True)copytree的第三个参数规定对符号链接的处理其中True表示保留符号链接;而False则意味着使用文件的物理副本替代符号链接。
Python语言能够很好地支持路径名的跨平台组成Os.path.join能使用正确的分界符(在UNIX和Mac OS X操作系统中使用/在 Windows 上使用)来联接目录和文件名变量os.curdir和os.pardir分别表示当前工作目录及其父目录。 像下面的UNIX操作系统命令cp ../../f1.c .可以使用Python语言提供一个跨平台的实现shutil.copy(os.path.join(os.pardir,os.pardir,’f1.c’), os.curdir)
os模块中的rename函数通常被用于重命名一个文件os.rename(myfile, ’tmp.1’) # 将myfile重命名为’tmp.1’
这个函数也可用来在相同的文件系统之内移动文件。这里我们将myfile移动到目录d下面os.rename(myfile, os.path.join(d, myfile))
在跨文件系统移动文件的时候可以先使用shutil.copy2来复制文件然后再删除原来的副本即可如下shutil.copy2(myfile, os.path.join(d, myfile))
os.remove(myfile) # 后面这种移动文件的方法是最安全的。
五、分解路径名假设我们使用变量fname来存放一个包含完整路径的文件名例如/usr/home/hpl/scripting/python/intro/hw.py
有时候我们需要将这样的文件路径拆分为基本名称hw.py和目录名/usr/home/hpl/scripting/python/intro。在Python语言中可以使用下列代码达到目的basename os.path.basename(fname)
dirname os.path.dirname(fname)# 或
dirname, basename os.path.split(fname)
扩展名是通过os.path.splitext函数提取出来的root, extension os.path.splitext(fname)
这样fname中的扩展名部分即.py被赋给变量extension而其余部分则赋给了变量root。如果想得到不带点号的扩展名的话只需使用os.path.splitext(fname)[1][1:]即可。假设一个文件名为f其扩展名随意若想将其扩展名改为ext可以使用下面的代码newfile os.path.splitext(f)[0] ext
下面是一个具体的示例 f ’/some/path/case2.data_source’moviefile os.path.basename(os.path.splitext(f)[0] ’.mpg’)moviefile
’case2.mpg’
六、目录的创建和移动os模块中的函数mkdir可以用来创建目录而chdir函数则可以移动目录如下origdir os.getcwd() # 将当前位置记下来
newdir os.path.join(os.pardir, ’mynewdir’)if not os.path.isdir(newdir):os.mkdir(newdir) # 或者os.mkdir(newdir,’0755’)os.chdir(newdir)
...
os.chdir(origdir) # 返回原目录
os.chdir(os.environ[’HOME’]) # 移到主目录
假设我们想要在自己的主目录下创建一个新目录py/src/test1但是目前py、src和test1都不存在。如果使用mkdir命令来创建的 话需要使用三次才能建好这个嵌套的目录但是使用Python语言提供的os.makedirs命令的话则无需这样麻烦了该命令可以一次建好整个目录os.makedirs(os.path.join(os.environ[’HOME’],’py’,’src’,’test1’))
七、遍历目录树下面的函数调用os.path.walk(root, myfunc, arg)
将遍历root目录树;然后对每个目录名dirname分别调用myfunc(arg, dirname, files)即可这里参数files是dir中的文件名列表(可通过调用os.listdir(dirname)来获得);arg是用户从调用代码中传 递来的参数。对于UNIX操作系统用户来说Python语言中跨平台的os.path.walk相当于Unix命令find。在解释os.path.walk的用法的时候人们常使用写出主目录中所有子目录内的文件的名称为例进行说明。当然我们也可以在一个交互式的Python命令行中使用下列代码段来体会os.path.walk的使用def ls(arg, dirname, files):print(dirname, ’has the files’, files)os.path.walk(os.environ[’HOME’], ls, None)
本例中参数arg并非必需所以在os.path.walk调用中让其取值为None即可。 为了列出主目录中所有大于1Mb的文件可以使用下面的代码def checksize1(arg, dirname, files):for file in files:filepath os.path.join(dirname, file)if os.path.isfile(filepath):size os.path.getsize(filepath)if size 1000000:size_in_Mb size/1000000.0arg.append((size_in_Mb, filename))bigfiles []root os.environ[’HOME’]
os.path.walk(root, checksize1, bigfiles)
for size, name in bigfiles:print(name, ’大小为’, size, ’Mb’)
现在我们使用arg来建立一个数据结构这里是一个2元组构成的列表其中每个2元组存放文件的尺寸(以MB为单位)和完整的文件路径。如果用于所有目录的函数调用中都要更改arg的话那么arg必须是一个可变的数据结构即允许适当地进行修改。参数dirname是当前正在访问的目录的绝对路径而参数files内的文件名则是相对于dirname的相对路径。在此期间当前工作目录并没有改 变那就是说该脚本仍然呆在脚本启动时刻所在的目录中。这就是为什么我们需要把filepath弄成带有dirname和file的绝对路径的原因。若要 改变当前工作目录为dirname只要在针对每个目录调用os.path.walk的函数中调用一下os.chdir(dirname)然后在该函数 的末尾重新调用os.chdir(dirname)将当前工作目录改回原值即可如下所示def somefunc(arg, dirname, files):origdir os.getcwd(); os.chdir(dirname)os.chdir(origdir)os.path.walk(root, somefunc, arg)
当然如果您愿意也可以编写具有类似功能的代码来替代os.path.walk。下面的代码将针对每个文件而非每个目录来调用的自定义函数如下所示def find(func, rootdir, argNone):# 对rootdir目录中的每个文件调用funcfiles os.listdir(rootdir) # 获取rootdir目录中的所有文件files.sort(lambda a, b: cmp(a.lower(), b.lower()))for file in files:fullpath os.path.join(rootdir, file)if os.path.islink(fullpath):passelif os.path.isdir(fullpath):find(func, fullpath, arg)elif os.path.isfile(fullpath):func(fullpath, arg)else:printfind: cannot treat, fullpath)
上面的函数find可以从scitools模块中获取。与内置函数os.path.walk相反我们的find函数以大小写敏感的字母顺序来访问文件和目录。 我们可以使用find函数来列出所有大于1Mb的文件def checksize2(fullpath, bigfiles):size os.path.getsize(fullpath)if size 1000000:bigfiles.append(’%.2fMb %s’ % (size/1000000.0, fullpath))bigfiles []
root os.environ[’HOME’]
find(checksize2, root, bigfiles)
for fileinfo in bigfiles:printfileinfo
参数arg带来了巨大的灵活性。我们可以使用它来同时存放输入数据和生成的数据结构。下一个范例将收集所有大于一定尺寸的带有规定扩展名的文件的文件名和大小。输出的结果按照文件大小排列。bigfiles {filelist: [], # 文件名和大小列表extensions: (.*ps, .tiff, .bmp),size_limit: 1000000, # 1 Mb
}find(checksize3, os.environ[’HOME’], bigfiles)def checksize3(fullpath, arg):treat_file Falseext os.path.splitext(fullpath)[1]import fnmatch # Unix的shell风格的通配符匹配
for s in arg[extensions]:if fnmatch.fnmatch(ext, s):treat_file True # fullpath带有正确的扩展名
size os.path.getsize(fullpath)
if treat_file and size arg[size_limit]:size %.2fMb % (size/1000000.0) # 打印arg[’filelist’].append({’size’: size, ’name’: fullpath})# 按照大小排列文件
def filesort(a, b):return cmp(float(a[’size’][:-2]), float(b[’size’][:-2]))bigfiles[’filelist’].sort(filesort)
bigfiles[’filelist’].reverse()
for fileinfo in bigfiles[’filelist’]:print(fileinfo[’name’], fileinfo[’size’])
注意为列表排序的函数bigfiles[filelist]函数中的每个元素就是一个字典键size保存着一个字符串不过在进行比较之前我们必须将单位Mb(最后两个字符)去掉并将其转换为浮点数。八、小结对于文件和目录的处理虽然可以通过操作系统命令来完成但是Python语言为了便于开发人员以编程的方式处理相关工作提供了许多处理文件和目录的 内置函数。重要的是这些函数无论是在Unix、Windows还是Macintosh平台上它们的使用方式是完全一致的。本文详细解释了这些函数的使 用方法其中我们首先介绍了显示目录内容的功能然后描述如何测试一个文件名对应的是一个标准文件、目录还是链接以及提取文件大小和日期的方法。之 后我们还将介绍如何删除文件和目录如何复制和删除文件以及怎样将一个完整的文件路径分解成目录部分和文件名部分最后我们讲解目录的创建以及如 何在目录树中移动目录并处理文件。