文件操作

更新时间: 2024-03-18 23:13:16

# 文件编码

编码技术即:翻译的规则,记录了如何将内容翻译成二进制,以及如何将二进制翻译回可识别内容。

计算机中有许多可用编码:UTF-8,GBK,Big5等

不同的编码,将内容翻译成二进制也是不同的

UTF-8是目前全球通用的编码格式,除非有特殊需求,否则,一律以UTF-8格式进行文件编码即可。

# 文件的读取

# open()打开函数

在Python,使用open函数,可用打开一个已经存在的文件,或者创建一个新的文件,语法如下:

open(name, mode, encoding)
1
  • name: 是要打开的目标文件名的字符串(可用包含文件缩在的具体路径)
  • mode: 设置打开文件的模式(访问模式):只读、写入、追加等
  • encoding: 编码格式(推荐使用 UTF-8)
模式 描述
r 以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式
w 打开一个文件只用于写入。如果改文件已存在则打开文件,并从头开始编辑,原有内容会被删除,如果该文件不存在,创建新文件
a 打开一个文件用于追加。如果该文件已经存在,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入
f = open('python.txt', 'r', encoding='UTF-8') 
# encoding的顺序不是第三位,所以不能用位置参数,用关键字参数直接指定
1
2

注意

此时的 f 是 open函数的文件对象,对象是Python中一种特殊的数据类型,拥有属性和方法,可以使用对象.属性或对象.方法对其进行访问

# 读操作相关方法

# read()方法

文件对象.read(num)
num表示要从文件中读取的数据的长度(单位是字节),如果没有传入num,那么就表示读取文件中所有的数据。

# readlines()方法

readlines可以按照行的方式把整个文件中的内容进行一次性读取,并且返回的是一个列表,其中每一行的数据为一个元素

f = open('python.txt')
content = f.readlines()

# ['hello world\n','abcdefg\n','aaa\n','bbb\n','ccc']
print(content)

# 关闭文件
f.close()
1
2
3
4
5
6
7
8

# readline()方法

一次读取一行内容

f = open('python.txt')

content = f.readline()
print(f'第一行:{content}')

content = f.readline()
print(f'第二行:{content}')

f.close()
1
2
3
4
5
6
7
8
9

# for循环读取文件行

for line in open("python.txt","r"):
  print(line)
# 没一个line临时变量,就记录了文件的一行数据
1
2
3

# close()关闭文件对象

f = open("python.txt","r")
f.close()
1
2

最后通过close,关闭文件对象,也就是关闭对文件的占用
如果不调用close,同时程序没有停止运行,那么这个文件将一直被Python程序占用

# with open语法

with open("python.txt", "r") as f:
  f.readlines()
1
2

通过再with open的语句块中对文件进行操作
可以在操作完成后自动关闭close文件,避免遗忘掉close方法

# 文件的写入

# 写操作快速入门

# 1.打开文件
f = open('python.txt','w')

# 2.文件写入
f.write('hello world')

# 3.内容刷新
f.flush()
1
2
3
4
5
6
7
8

注意:

  • 直接调用write,内容并未真正写入文件,而是会积攒在程序的内存中,称之为缓冲区
  • 当调用flush的时候,内容会真正写入文件
  • 这样做是避免频繁操作硬盘,导致效率下降(攒一堆,一次性写磁盘)

注意

  • w模式,文件不存在,会创建新文件
  • w模式,文件存在,会清空原有内容
  • close()方法,带有flush()方法的功能

# 文件追加写入

# 1.打开文件,通过a模式打开即可
f = open('python.txt','a')

# 2.文件写入
f.write('hello world')

# 3.内容刷新
f.flush()
1
2
3
4
5
6
7
8