練習-Pandas 讀取csv
Pandas
Pandas是一種處理結構性資料的Python程式庫,擅長處理資料問題,功能如下
- 讀取和寫入多種文字和二進制檔案格式:
- 文字,其欄位以逗號分隔(CSV)、以tab分隔(TSV)或以其他字元分隔
- 固定寬度文字
- Excel
- Json
- HTML表
- SQL
- HDF5
- 其他
- 分群、拆開、合併、檢索、slice、排序、選擇、標記
- 轉換資料型態
- 改變大小或外型(shape)
- 處理缺漏資料
- 產生隨機值
- 管理時間序列
他的讀取函式匯回傳一個DataFrame物件,他是Pandas表示二維資料(列與欄)的標準格式。這種格式很多方面很像試算表或關聯資料庫的資料表。
他的一維弟弟是Series
import csv
#製作一個練習用CSV檔
villains=[
{'first':"Doctor",'last':"No"},
{"first":'Rosa','last':"Klebb"},
{'first':'Mister','last':'Big'},
{'first':'Auric','last':'Goldfinger'},
{'first':'Ernst','last':'Blofeld'}
]
with open('villains.csv','wt')as f:
file=csv.DictWriter(f,['first','last'])
#創建一個csv.DictWriter對象,file
#並指定要寫入的列名為['first','last']
#注意這邊的列名必須對應要寫入的字典中的key
file.writeheader()
#寫入CSV文件的頭部也就是列名
file.writerows(villains)
#將列表villains中的字典數據逐行寫入CSV文件,
#每個字典的鍵與列名對應,鍵對應的值將作為該行的數據
#writerows()的引數是列表
#writerow()的引數是字典
import pandas
data=pandas.read_csv("villains.csv")
print(data)
--------------------------終端機
first last
0 Doctor No
1 Rosa Klebb
2 Mister Big
3 Auric Goldfinger
4 Ernst Blofeld
標籤: 練習

0 個意見:
張貼留言
訂閱 張貼留言 [Atom]
<< 首頁