2022-01-17 11:14:19|已浏览:151次
Python最主要的应用就是爬虫,即自动获取网页内容的程序。文件是网页内容的重要存储模式,如何利用Python读取文件呢?今天老师就来给大家分享一下Python初学者教程中关于读取文件的有关知识。
大局部爬虫一般按照“发送恳求——取得页面——解析页面——抽取并贮存内容”的流程,想要读取信息,我们就要了解数据的存储方式,其中文件格式是比较常见的一种。所谓文件格式,是指文件中存储信息的一种标准方法。首先,文件格式指定文件是一个二进制或ASCII文件。其次,文件展示了文件的组织形式,如CSV、XLSX等。import pandas as pd使用Python读取TXT纯文本
pf = pd.read_csv('train.csv')
text_file = open("text.txt", "r")使用Python读取ZIP文件
lines = text_file.read()
import zipfile使用Python读取XLSX文件
archive = zipfile.ZipFile('T.zip', 'r')
df = archive.read('train.csv')
import pandas as pd除了以上文件类型,使用Python你还可以读取XML、HTML、JSON等程序,基于Python简单易学、应用广泛的特性,越来越多的人选择学习Python编程语言。
pf = pd.read_excel('train.xlsx',sheetname = 'invoice')
注:尊重原创文章,转载请注明出处和链接 https://www.pxwy.cn/news-id-15593.html 违者必究!部分文章来源于网络由培训无忧网编辑部人员整理发布,内容真实性请自行核实或联系我们,了解更多相关资讯请关注python培训频道查看更多,了解相关专业课程信息您可在线咨询也可免费申请试课。关注官方微信了解更多:150 3333 6050