分析问题所用的数据都是保存在数据文件中的,首先就要从数据文件读取数据。
1、数据文件的格式很多,最常用的是 .csv,.xls 和 .txt 文件,以及 sql 数据库文件的读取。
2、使用pandas 从数据文件导入数据的程序最为简单。
不同格式的使用案例
(1)读取 .csv 文件:
df = pd.read_csv("./example.csv", engine="python", encoding="utf_8_sig") # engine="python"允许处理中文路径,encoding="utf_8_sig"允许读取中文数据
(2)读取 .xls 文件:
df = pd.read_excel("./example.xls", sheetname='Sheet1', header=0, encoding="utf_8_sig") # sheetname 表示读取的sheet,header=0 表示首行为标题行, encoding 表示编码方式
(3)读取 .txt 文件:
df = pd.read_table("./example.txt", sep="\t", header=None) # sep 表示分隔符,header=None表示无标题行,第一行是数据
本文链接:http://so.lmcjl.com/news/8563/