資料拆分是整理原始資料(Raw Data)的關鍵步驟,能夠直接影響後續分析的準確性與效率。Power Query的「分割資料行」功能正是為此設計。藉由拆分作業,可以將複雜或混雜的數據資料分解為更有意義的部分,以便進行分析和整理。並且符合資料庫正規化原則,也能利於與其他系統的整合。
在整理資料與彙整資料上,最常用使用的技巧是資料的拆分與群組。在Power Query的操作環境裡,分別可以透過[分割資料行]與[分組依據]功能選項來完成;而匯入的資料來源其內容也經常會是報表的標題文字列,與欄位名稱標題列,因此,必須透過多餘資料列的移除。以及將資料列升階為標題列的操作,來建構出標準的結構化資料表。
在這次的範例中,「主場城市」欄位的內容包含了城市名稱與州名,我們可以再點選此欄位後,點按[常用]/[分割資料行]命令按鈕來進行資料行的拆分。
此時,可以從展開的功能選單中點選[依分隔符號]功能選項。
開啟[依分隔符號分割資料行]對話選項,Power Query會自動識別出此範例資料的內容是以自訂的全形逗點「,」為分隔符號,就直接點按[確定]囉!
隨時立即完成資料行的分割作業,而此次的操作一共執行了2個查詢步驟:「依分隔符號分割資料行」以及「已變更類型1」,延續在先前匯入外部資料檔案時所產生的3個查詢步驟之後。
在一分為二後,就直接點按兩下資料行名稱,重新輸入新的欄位命名。譬如:「主場城市」與「州別」,而這兩次的連續操作都是進行資料行名稱的異動,因此僅產生一個名為[已重新命名資料行]的查詢步驟。對於此例而言,我們便是建立了一個名為[NBA球隊]的查詢,而到目前為止我們一共進行了6個查詢步驟,最終的查詢結果是9個資料行、30筆資料列的資料表。
前一篇:<<Power Query的學習與M語言實作系列 - (2/5) 學習Power Query編輯器>>
下一篇:<<Power Query的學習與M語言實作系列 - (4/5) Power Query查詢結果的輸出選項>>