CSV(Comma-Separated Values)是一種簡單且普遍的輕量級的純文字資料格式,用來儲存表格數據。每欄(資料行)的資料均以逗號分隔,資料列則以換行標記,其特性包括結構簡單、易讀寫,且兼容幾乎所有數據處理工具(如 Excel、Python、Power Query)。檔案體積小、解析高效,並可跨平台使用,無需專用軟體即可編輯。廣泛應用於數據交換、資料庫匯入/匯出及分析領域,是數據科學和商業報表中最普及的格式之一。所以,許多企業、政府單位、機關團體、資訊系統等各領域廣受歡迎。
首先,我們就以一個最通俗、常見的.csv檔案格式來實作Power Query的基本操作。此檔案的內容是記載了美國NBA職籃的30支球隊基本資料,共計有 "所屬聯盟"、"分區"、"球隊名稱"、"主場城市"、"成立年份"、"主場球館名稱 (英文)"、"容納人數" 以及 "總冠軍次數" 等8個資料欄位。(實作檔案 NBA.csv 下載)
在開啟Excel應用程式後,直接點按[資料]索引標籤裡的[從文字/CSV]命令按鈕:
或者,點按[資料]索引標籤裡[取得資料]命令按鈕,在下拉式功能選單中有更完整的多種資料來源選擇。點選[從檔案]選項後,即可從展開的副選單裡看到常見的各種不同類型之資料檔案,[從文字/CSV]的選項也在此。
開啟[匯入資料]對話方塊,點選此次的實作範例:[BNA球隊.csv]並按下[匯入]按鈕。
通常在操作Power Query匯入外部資料檔案時,都會歷經導覽資料的過程,而不同性質的資料來源其匯入時的導覽畫面不盡相同也略有差異。此例我們所匯入的檔案格式是.csv檔案,在Power Query匯入外部資料的導覽畫面,除了可以檢視所匯入的局部資料內容外,編碼的調整(檔案原點)、分隔符號的選項,都呈現在導覽畫面上方,而導覽畫面底部亦提供有[載入]按鈕與[轉換資料]按鈕,讓您選擇直接載入資料,或是進入Power Query編輯器進行下一階段的處理。此次實作我們就直接點按[匯入]按鈕。
隨即結束匯入資料的操作,返回Excel工作表畫面,看到原本的外部資料檔案,也就是,csv格式的檔案內容,立即複本連結至工作表上,以資料表格式呈現。這番操作也代表您已經建立了一個名為[NBA球隊]的查詢,在視窗右側的[查詢與連線]工作窗格裡亦顯示著此查詢的名稱以及匯入資料的筆數(30筆資料列)。
就真有這麼簡單,一個匯入操作,透過導覽畫面就直接將外部資料匯入到活頁簿的工作表裡了!但好像都還沒有看到Power Query的操作畫面,也還沒見識到Power Query的精髓!是的,那是因為所要匯入的外部資料檔案,如果正是需要的內容,不需要篩選也不需要整理、轉換,當然可以直接在導覽畫面時就按下[匯入]按鈕而直接將原汁原味的腕部資料全部匯入到Excel工作表上。
衷心建議
其實,即便是最簡單的資料檔案格式,在透過Power Query進行匯入操作時,筆者也不建議您直接在導覽畫面的過程,就直接按下[匯入]按鈕而照單全收的盡入眼簾,意即不聞不問的全部匯入到工作表上。因為,資料總是需要篩選欄(Columns)或列(Rows),甚至對匯入的資料進行拆分、組合、轉換等操作,去蕪存菁的留下所要的資料。所以,即便是Power Query的箇中高手,也常會在導覽畫面的過程,按下[轉換資料]按鈕,以期將匯入的資料交付給Power Query查詢編輯器,進行後續更完整且多元的資料處理作業與輸出選擇。
隨即進入Power Query的核心程式,也就是Power Query查詢編輯器,在此功能區裡包含了[檔案]後台管理,以及[常用]、[轉換]、[新增資料行]與[檢視表]等四個索引標籤,讓使用者可以進行更完整的查詢工作,包括資料的轉換、拆分、合併、新運算欄位的建立、選擇查詢的輸出等等作業。
下一篇:<<Power Query的學習與M語言實作系列 - (2/5) 學習Power Query編輯器>>