Skip to content

文件基础操作

参考资料:

一、编码

enconding(编码),是一种规则的集合,记录了内容和二进制之间的相互转换的逻辑。

计算机只能识别 0 和 1 ,使用 enconding 可以将数据转换为0和1,存储在硬盘中。

计算机中有许多可用编码:UTF-8、GBK、Big5 等不同的编码,将内容翻译成二进制也是不同的;对内容的编码与解码必须使用同一套编码,否则会导致错误的结果。

UTF-8 是目前全球通用的编码格式,除非有特殊需求,否则,一律以 UTF-8 格式进行文件编码即可。

二、文件操作

在日常生活中,文件操作主要包括打开、关闭、读、写等操作;

操作过程中请务必注意文件路径的书写:

  • 只有操作文件与python文件在同一目录才能直接写文件名;
  • 新手建议都写文件的绝对路径,不易导致错误发生

1.open

使用 open() 函数,可以打开一个已经存在的文件,或者创建一个新文件:

python
open(name, mode, encoding)
# name:是要打开的目标文件名的字符串(可以包含文件所在的具体路径)。
# mode:设置打开文件的模式(访问模式):只读、写入、追加等。
# encoding:编码格式(推荐使用UTF-8)

文件常用的三种基础访问模式,可通过 mode 指定:

模式描述
r以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。
w打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,原有内容会被删除。如果该文件不存在,创建新文件。
a打开一个文件用于追加。如果该文件已存在,新的内容将会被写入到已有内容之后。 如果该文件不存在,创建新文件进行写入。

示例代码:

python
file_path = "/Users/cola1213/Downloads/03.txt"

# open file
f = open(file_path, "r", encoding="utf-8")

2.read

文件的读取,每次读取会从上一次读取结束的位置开始,每次 open() 中的内容只能被读取一次:

操作功能
文件对象.read(num)读取指定长度字节 不指定num读取文件全部
文件对象.readline()读取一行
文件对象.readlines()读取全部行,返回列表
for line in 文件对象for循环文件行,一次循环得到一行数据
文件对象.close()关闭文件对象
with open() as f通过with open语法打开文件,可以自动关闭

示例代码:

python
f = open("C:/code/test.txt", "r", encoding="UTF-8")
content = f.read() # 不传入num,读取文件中所有的数据。
print(content)
# 打印
# 观止
# study

f = open("C:/code/test.txt", "r", encoding="UTF-8")
content = f.read(2) # 传入num,读取2字节长度数据。
print(content)
# 打印
# 观止

f = open("C:/code/test.txt", "r", encoding="UTF-8")
content = f.readline()
print(f"第一行内容:{content}")  # 打印 第一行内容:观止
content = f.readline()
print(f"第二行内容:{content}")  # 打印 第二行内容:study

f = open("C:/code/test.txt", "r", encoding="UTF-8")
content = f.readlines()
print(content)  # 打印 ['观止\n', 'study']
print(type(content))  # 打印 <class 'list'>

# 每一个line临时变量,就记录了文件的一行数据
for line in open("C:/code/test.txt", "r", encoding="UTF-8"):
    print(line)
# 打印
# 观止
#
# study

f = open("C:/code/test.txt", "r", encoding="UTF-8")
# 需要执行代码
f.close()

with open("C:/code/test.txt", "r", encoding="UTF-8") as f:
  f.readlines()

3.write

直接调用 write ,内容并未真正写入文件,而是会积攒在程序的内存中,称之为缓冲区

  • 当调用 flush 的时候,内容会真正写入文件
  • close() 方法,附带flush()方法的功能

这样做是避免频繁的操作硬盘,导致效率下降(攒一堆,一次性写磁盘)

python
f = open("C:/code/test.txt", "w")
# 文件如果不存在,使用”w”模式,会创建新文件
# 文件如果存在,使用”w”模式,会将原有内容清空
f.write('hello world')
f.flush()

# 使用a模式,文件不存在会创建文件,文件存在会在最后追加内容写入文件
f = open("C:/code/test.txt", "a")
f.write('study')
f.flush()