2023年7月2日 星期日

練習-Pandas 讀取csv

Pandas

Pandas是一種處理結構性資料的Python程式庫,擅長處理資料問題,功能如下
  • 讀取和寫入多種文字和二進制檔案格式:
    • 文字,其欄位以逗號分隔(CSV)、以tab分隔(TSV)或以其他字元分隔
    • 固定寬度文字
    • Excel
    • Json
    • HTML表
    • SQL
    • HDF5
    • 其他
  • 分群、拆開、合併、檢索、slice、排序、選擇、標記
  • 轉換資料型態
  • 改變大小或外型(shape)
  • 處理缺漏資料
  • 產生隨機值
  • 管理時間序列
他的讀取函式匯回傳一個DataFrame物件,他是Pandas表示二維資料(列與欄)的標準格式。這種格式很多方面很像試算表或關聯資料庫的資料表。
他的一維弟弟是Series




import csv
#製作一個練習用CSV檔

villains=[
    {'first':"Doctor",'last':"No"},
    {"first":'Rosa','last':"Klebb"},
    {'first':'Mister','last':'Big'},
    {'first':'Auric','last':'Goldfinger'},
    {'first':'Ernst','last':'Blofeld'}
]
with open('villains.csv','wt')as f:
    file=csv.DictWriter(f,['first','last'])
    #創建一個csv.DictWriter對象,file
    #並指定要寫入的列名為['first','last']
    #注意這邊的列名必須對應要寫入的字典中的key
    file.writeheader()
    #寫入CSV文件的頭部也就是列名
    file.writerows(villains)
    #將列表villains中的字典數據逐行寫入CSV文件,
    #每個字典的鍵與列名對應,鍵對應的值將作為該行的數據
    #writerows()的引數是列表
    #writerow()的引數是字典

import pandas
data=pandas.read_csv("villains.csv")
print(data)


--------------------------終端機
first last 0 Doctor No 1 Rosa Klebb 2 Mister Big 3 Auric Goldfinger 4 Ernst Blofeld




標籤:

0 個意見:

張貼留言

訂閱 張貼留言 [Atom]

<< 首頁