咨询热线 400-001-5729

Python3编码如何实现文件操作

发布时间:2023-03-02 09:19:59

python做数据分析的优点


    想要通过 Python 代码操作某个文件,必须要有三个元素:

  • path:文件的路径

  • mode:r / w / r+ / w+ / a

  • encoding:编码方式

    2. 文件句柄包括:f / file / file_handler, f_h...

    3. open() 是内置函数,实际上是调用操作系统对文件操作的功能

    4. 各系统的默认编码方式:

  • Windows:GBK

  • Linux:UTF-8

  • IOS:UTF-8

     5. 对文件的任何操作都需要借助文件句柄

    6. f.close():打开某个文件后一定要记得关闭它,否则会一直在内存中占用资源

    7.打开某个文件并读取其中内容的方法:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
f = open("G:test.txt", mode="r", encoding="utf-8")
content = f.read()
print(content)
f.close()
  
# 运行报错,原因解析:
# 路径错误,系统会认为 t 是一个转义字符
# 解决办法:
# 1) "G:test.txt"
# 2) r"G:test.txt"
# 另外,这里不能把反斜杠  改为斜杠 /,因为不同系统之间的斜杠与反斜杠之间会有不同的定义
  
# 使用 open() 打开某个文件报错,除了上面提到的路径问题
# 还有一个可能的原因,即编码问题
# 比如在 Windows 系统上编写了一个 .txt 文件并保存
# 在 Pycharm 里面打开该文件就会发现内容很有可能是乱码的
# 原因就是两者的编码方式是不一样的

 

8. 文件操作涉及到路径问题,路径分为两种: 

  • 绝对路径:从磁盘根目录开始,直到找到文件

  • 相对路径:从当前路径 (当前文件夹) 找到文件


     9. r 模型下的五种读取方式

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
# 假设 test.txt 文件与本 Python 文件在同一个目录下
# test.txt 文件里的内容如下:
这是第一行的内容...
这是第二行的内容...
这是第三行的内容...
这是第四行的内容...
这是第五行的内容...
  
  
  
######## 1. read():全部读取出来 ########
f = open("test.txt", mode="r", encoding="utf-8")
content = f.read()
print(content)
f.close()
  
# 运行结果:
这是第一行的内容...
这是第二行的内容...
这是第三行的内容...
这是第四行的内容...
这是第五行的内容...
  
  
  
######## 2. read(n):读取 n 个字符 ########
f = open("test.txt", mode="r", encoding="utf-8")
content = f.read(3)
print(content)
f.close()
  
# 运行结果:
这是第
  
  
  
######## 3. readline():按行读取 ########
f = open("test.txt", mode="r", encoding="utf-8")
line1_content = f.readline()
print(line1_content, type(line1_content))
# 这是第一行的内容...
# <class 'str'>
line2_content = f.readline()
print(line2_content, type(line2_content))
# 这是第二行的内容...
# <class 'str'>
f.close()
  
  
  
######## 4. readlines():返回一个列表 ########
f = open("test.txt", mode="r", encoding="utf-8")
content = f.readlines()
print(content)
f.close()
  
# 运行结果:
['这是第一行的内容...n', '这是第二行的内容...n', '这是第三行的内容...n', '这是第四行的内容...n', '这是第五行的内容...n']
  
  
  
######## 5. for 循环:读取大文件 ########
# 当一个文件很大时,比如它有 9G,但是电脑内存只有 8G
# 如果使用上面的方法一次性全部读取出来,那么电脑就会挂掉
# 解决办法就是使用 for 循环,只有每次循环时才占内存
f = open("test.txt", mode="r", encoding="utf-8")
for line in f:
    print(line.strip())
f.close()
  
# 运行结果:
这是第一行的内容...
这是第二行的内容...
这是第三行的内容...
这是第四行的内容...
这是第五行的内容...
  
# 如果是直接 print(line),注意看结果:
这是第一行的内容...
  
这是第二行的内容...
  
这是第三行的内容...
  
这是第四行的内容...
  
这是第五行的内容...

      以上就是Python3编码实现文件操作的方法。不知道有小伙伴一次看明白了没有,给学会了的小伙伴点个赞。没有学会的小伙伴也不要着急,代码都在上面可以慢慢尝试,相信你们一定可以的。


以上文章由西安CDA数据分析师培训机构课程顾问整理编辑发布,部分文章来自网络内容真实性请自行核实或联系我们,了解相关专业课程信息您可在线咨询也可免费申请试课。关注官方微信了解更多:150 3333 6050

免 费 申 请 试 课