猪行天下之Python基础——7.1 文件存储

1,728 阅读10分钟

内容简述:

  • 1、open()函数与文件打开模式
  • 2、file对象提供的函数
  • 3、常见的文件操作示例
  • 4、os模块里的常用函数
  • 5、实用代码示例

1、open()函数与文件打开模式

Python中读写文件非常简单,通过 open()函数 可以打开文件并返回文件对象。我们可以使用help函数来查看open函数具体的参数:

open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)

一般了解前两个参数就够了,file参数代表文件名,如果不带上路径的话,会在当前文件夹里查找, 而mode参数代表文件的打开模式,有如下表所示的几种打开模式:

模式 作用
r 只读模式打开,默认
w 写模式打开,若文件存在,先删除,然后重新创建
a 追加模式打开,追加到文件末尾,seek()指向其他地方也没用,文件不存在,自动创建
b 二进制模式打开
t 文本模式打开,默认
+ 可读写模式,可配合其他模式使用,比如r+,w+
x 如果文件已存在,用此模式打开会引发异常
U 通用换行符支持

另外,实用open函数打开文件时要做下:异常捕获,比如下面这样的代码:

f = open('test.txt''r')

如果test.txt文件不存在的话,会抛出一个FileNotFoundError错误,所以需要进行异常捕获。另外,文件使用完毕后必须关闭,文件对象会占用操作系统的资源,操作系统同一时间能打开的文件数量也是有限的。所以为了保证正常或发生异常的时候文件都能关闭,需要把关闭操作写到finally块里,示例代码如下:

try:
    f = open('test.txt''r')
    print(f.read())
finally:
    if f:
        f.close()

但是每次都要这样写的话显得有些繁琐了,可以使用Python提供的with语句来简化这个操作。

with open('test/txt''r'as f:
    print(f.read())

相比每次都要写try-finally异常捕获,这种方式简洁得多,而且不用怕忘记关闭文件。


2、file对象提供的函数

file对象提供了如下表所示的可供调用的方法:

函数 作用
close() 关闭文件,关闭后文件不能再进行读写操作
read(size=-1) 从文件读取指定的字节数,如果未设置或为负数,读取所有
next() 返回文件下一行
readline() 读取整行,包括换行符'\n'
seek(offset, from) 设置当前文件指针的位置,从from(0文件起始位置,1当前位置,
2文件末尾)偏移offset个字节
tell() 返回文件的当前位置
write(str) 将字符串写入文件
writelines(seq) 写入一个序列字符串列表,如果要换行,需要自己加入每行的换行符
truncate([size]) 截断文件并返回截断的字节长度,指定长度就从开头开始截断指定长度,
其余内容删除;不指定的话,从开头截取到当前位置,其余内容删除。

3、常见的文件操作示例

文件的常用操作有创建,写入,读取,还有追加,代码示例如下:

# 1.创建一个可读写的文件
def mk_file(file):
    with open(file, 'w+', encoding='UTF-8'as f:
        print("创建了一个可读写的文件:%s" % file)


# 2.往文件中写入内容
def write_to_file(file, content):
    with open(file, 'w+', encoding='UTF-8'as f:
        f.write(content + '\n')
        print("内容写入成功!")


# 3.读取文件里的内容
def read_from_file(file):
    with open(file, 'r+', encoding='UTF-8'as f:
        print("输出文件内容:" + f.read())


# 4.往文件追加内容
def append_to_file(file, content):
    with open(file, 'a+', encoding='UTF-8'as f:
        f.write(content + '\n')
        print("内容追加成功!")


if __name__ == '__main__':
    file_name = 'test.txt'
    mk_file(file_name)
    write_to_file(file_name, "人生苦短我用Python!")
    read_from_file(file_name)
    append_to_file(file_name, "Hello Python!")
    read_from_file(file_name)

运行结果如下

创建了一个可读写的文件:test.txt
内容写入成功!
输出文件内容:人生苦短我用Python

内容追加成功!
输出文件内容:人生苦短我用Python
Hello Python

4、os模块里的常用函数

Python中为我们提供了一个os模块用于处理文件和目录,除此之外它的子模块path模块还提供了文件路径相关的一些函数,通过这些函数可以完成文件或者文件夹的批处理操作,比如文件批量改名,内容替换等。


① os模块常用函数

os模块常用的函数如下表所示:

函数 作用
close() 关闭文件,关闭后文件不能再进行读写操作
getcwd() 返回当前工作目录
chdir(path) 改变当前工作目录
listdir(path='.') 不写参数默认列举当前目录下所有文件和文件夹,'.'当前目录,
'..'上一层目录
mkdir(path) 创建文件夹,若存在会抛出FileExistsError异常
mkdirs(path) 可用于创建多层目录
remove(path) 删除指定文件
rmdir(path) 删除目录
removedirs(path) 删除多层目录
rename(old,new) 重命名文件或文件夹
system(command) 调用系统提供的小工具,比如计算器
walk(top) 遍历top参数指定路径下所有子目录,返回一个三元组(路径,
[包含目录],[包含文件])
curdir 当前目录(.)
pardir 上一节目录(..)
sep 路径分隔符,Win下是'\',Linux下是'/'
linesep 当前平台使用的行终止符,win下是'\r\n',Linux下是'\n'
pathsep 输出用于分割文件路径的字符串
name 当前使用的操作系统
stat(path) 获取文件目录信息
environ 获取系统环境变量
system("bash command") 执行shell命令,直接显示

② os.path模块常用函数

os.path模块常用的函数如下表所示:

函数 作用
dirname(path) 获得路径名
basename(path) 获得文件名
join(path1[,path2[,…]]) 将路径名与文件名拼接成一个完整路径
split(path) 分割路径与文件名,返回元组(f_path, f_name),如果完全使用目录,它也会将最后一个目录作为文件名分离,且不会判断文件或目录
是否存在
splitext(path) 分隔文件名与扩展名
getsize(file) 获得文件大小,单位是字节
getatime(file) 获得文件最近访问时间,返回的是浮点型秒数
getctime(file) 获得文件的创建时间,返回的是浮点型秒数
getmtime(file) 获得文件的修改时间,返回的是浮点型秒数
exists(path) 判断路径(文件或目录)是否存在
isabs(path) 判断是否为决定路径
isdir(path) 判断是否存在且是一个目录
isfile(path) 判断是否存在且是一个文件
islink(path) 判断是否存在且是一个符号链接
ismount(path) 判断是否存在且是一个挂载点
samefile(path1,path2) 判断两个路径是否指向同一个文件

5、实用代码示例

① 批量替换多个文件中的内容

比如说现在有这样一批文件,文件内容都是:

1.Java是一门面向对象编程语言,不仅吸收了C++语言的各种优点,还摒弃了C++
里难以理解的多继承、指针等概念,因此Java语言具有功能强大和简单易用两个特征。
Java语言作为静态面向对象编程语言的代表,极好地实现了面向对象理论,允许程序员
以优雅的思维方式进行复杂的编程。

现在需要把文件里的Java都替换成Python,我们可以通过编写脚本来完成这项繁琐的工作,具体代码如下:

import os

def replace(dir_path, word_before, word_after):
    file_list = []
    # 遍历获得文件地址
    for f in os.listdir(dir_path):
        file_list.append(os.path.join(dir_path, f))
    # 打开文件,按行读取,替换对应内容
    for file in file_list:
        with open(file'r+'encoding='UTF-8'as f:
            content = f.read()
            f.seek(0)
            f.truncate()
            f.write(content.replace(word_before, word_after))

if __name__ == '__main__':
    replace(os.path.join(os.getcwd(), 'doc'), 'Java''Python')

运行结果如下

1.Python是一门面向对象编程语言,不仅吸收了C++语言的各种优点,还摒弃了C++里难以理解的多继承、指针等概念,因此Python语言具有功能强大和简单易用两个特征。Python语言作为静态面向对象编程语言的代表,极好地实现了面向对象理论,允许程序员以优雅的思维方式进行复杂的编程。

② 批量文件重命名

有时我们需要对一堆文件进行批量命名,比如需要把下面这样的图片名字统一改成image_1这样的形式。在学习本节之前,你可能需要复制下image_,然后一个个图片重命名,学习完本节后我们可以动手写一个批量文件重命名的脚本。

程序还是比较简单的,分两步:

  • 1.获取某个文件夹里所有的文件完整路径名
  • 2.调用file对象的rename函数仅限替换

具体代码如下

import os
def rename(file_dir, model_name, file_type):
    pos = 1
    # 获取文件夹下所有文件(包括文件夹)
    file_list = os.listdir(file_dir)
    for file in file_list:
        # 判断是否为对应后缀的文件
        if file.endswith(file_type):
            try:
                # 旧文件名
                old_name = os.path.join(file_dir, file)
                # 新文件名
                new_name = os.path.join(file_dir, model_name + str(pos) + file_type)
                os.rename(old_name, new_name)
                pos = pos + 1
            except:
                continue
rename(os.path.join(os.getcwd(), 'res'), 'image_''.png')

运行结果如下

1s不到改完108个图片,简直不要太爽,真人生苦短,我用Python!


如果本文对你有所帮助,欢迎
留言,点赞,转发
素质三连,谢谢😘~