Power Query三大容器實作系列 - (1/7) Power Query的資料型態

數據的資料型態主要可以區分為結構化資料非結構化資料。在微軟的Excel以及BI解決方案中,Power Query這個應用程式是用來存取結構化資料與非結構化資料的一項整合工具,也是微軟利用Excel及Power BI進行資料整合與分析的一項大突破。

Power Query的資料型態

所謂的資料型態(Data Type)也稱之為資料型別,是指物件所能保留之資料類型的屬性,也就是在資料表裡儲存資料時,針對資料欄位的資料型態之定義。常見的資料類型包括文字(字串)、整數、精確位數、浮點數、字元、貨幣資料、日期和時間資料、二進位字串等原始數據類型。不過,在Excel的活頁簿工作環境裡,儲存格所儲存的資料內容僅是數字、文字或帶有運算式的公式,而公式的呈現也僅是公式執行後的結果,此結果也不外乎是文字或數值。至於我們所看到的工作表上的儲存格顯示著日期、帶有金融符號的金額、…這些都是拜儲存格格式設定之賜。有了儲存格的格式設定,才能讓報表的呈現更具可讀性也更有意義。然而,骨子裡儲存在工作表裡儲存格的內容不是數字就是文字或公式,其資料內容,並沒有資料型態的概念。

學過資料庫或程式設計的朋友們應該都知道,傳統的資料庫系統都是具備資料型態(Data Type)的,藉由資料型態來定義資料庫中各個欄位或變數的性質與格式的屬性。透過資料型態限制該欄位可以存儲的資料種類與規格,即可確保資料的一致性與完整性。而身為資料連接、清理與轉換工具的Power Query,自然也是處理資料庫的神器,也就能夠存取並規範資料型態。例如:在匯入資料至Power Query後,即可看到建立的查尋會自動也可以手動設定與調整每一個資料欄位的資料型態。基本的資料型態(Data Type),不外乎是文字、數值、日期、時間、邏輯、…等等。

在Power Query的環境裡,則提供了以下所示的多種常見資料型態:

文字 (Text):用於存儲字串資料。

  • 數字 (Number):
  • 整數 (Whole Number):用於儲存整數值。
  • 小數 (Decimal Number):用於儲存浮點數。
  • 固定小數 (Fixed Decimal Number):也稱為貨幣型別,適合需要高精度的數值。
  • 日期與時間 (Date/Time):
  • 日期 (Date):僅包含日期部分。
  • 時間 (Time):僅包含時間部分。
  • 日期時間 (DateTime):包含日期和時間。
  • 日期時間區域 (DateTimeZone):包含時區資訊的日期時間。
  • 持續時間 (Duration):表示時間間隔。
  • 布林值 (True/False):邏輯值,僅有 True 或 False。
  • 二進制 (Binary):用於存儲二進制資料,例如檔案或圖片。

此外,Power Query 還有一些進階型別,例如 Null(表示空值)和 Any(表示未定義的資料型態)。這些資料型態可以幫助使用者在處理資料時更精確地定義欄位的性質。在Power Query編輯器的視窗裡,資料欄位名稱左側也都會顯示該與資料欄位之資料型態十分貼切的圖示。

 

下一篇:<<Power Query三大容器實作系列 - (2/7) Power Query的三大容器>>