什麼是 pandas?
pandas是Python中資料處理、分析最強的套件,
沒有之一pandas的命名主要來自套件中最主要的三大資料結構Panel、DataFrame、Series
這堂課我們會把重點放在最常使用到的[DataFrame]上
為什麼要學 pandas?
處理結構化(Table like)的資料非常快速,如excel、csv等
報表自動化,寫好程式一勞永逸把每週都要做的剪貼、整理工作完成
從資料庫(MSSQL、MySQL、sqlite...等)提取數據快速便利
支援各種作圖、視覺化(matplotlib)
這堂課你將會學到什麼?
初步認識Series、DataFrame、Panel
資料讀入、輸出 excel/csv -> DataFrame 、 DataFrame -> excel/csv
資料轉換 dict -> DataFrame 、 list(array) -> DataFrame
資料描述與查看
concat (資料合併)
merge (資料連接,類似excel的vlookup、sql的join)
資料選擇與篩選
資料排序