在資料處理的過程中,經常需要將檔案額外進行處理,才能進行下一個步驟。
舉例來說,若抓取一份台股每天加權指數的資料,但需要知道每月的開盤、收盤價,
要怎麼做呢? (p.s. 每月第一天、最後一天交易日,未必是1號和31號)
原始資料格式如下,Date為每天交易日,YearMonth為預先計算的年月,Open、Close分別代表開盤價和收盤價。
Date | YearMonth | Open | High | Low | Close | Adj Close |
2000/1/4 | 2000/1/1 | 8644.91 | 8803.61 | 8642.5 | 8756.55 | 8756.518 |
2000/1/5 | 2000/1/1 | 8690.6 | 8867.68 | 8668.02 | 8849.87 | 8849.838 |
2000/1/6 | 2000/1/1 | 8900.56 | 9023.99 | 8833.91 | 8922.03 | 8921.997 |
2000/1/7 | 2000/1/1 | 8853.43 | 8940.77 | 8739.43 | 8849.87 | 8849.838 |
… | … | … | … | … | … | … |
… | … | … | … | … | … | … |
2000/1/31 | 2000/1/1 | 9653.24 | 9749.51 | 9613.8 | 9744.89 | 9744.853 |
… | … | … | … | … | … | … |
2000/2/29 | 2000/2/1 | 9525.65 | 9581 | 9410.11 | 9435.94 | 9435.906 |
處理的方式簡單2個大步驟:
1.計算每月第一天和最後一天交易日是何時 (如:2月最後一天交易日為2/29)。(使用Power BI Group by功能)
2.再依據日期取得的開盤或收盤價。(使用Power BI Merge合併功能)
步驟1: 依據月群組,計算最晚的日期(Max Date)和最早的日期(Min Date)
步驟2: (此圖僅示範取得每月開盤價。依據開盤日期合併原始資料找到開盤價)
完成後就可以利用資料畫出by月的開盤趨勢圖
同時也歡迎追蹤Tableau Public Gallery- MR.360 |聚沙成塔,裡面包含文章中的案例實作,
期待能帶給您新的啟發或靈感。
未來文章將喬遷新址「一趟數據分析之旅」,歡迎追蹤繼續支持,您將不會錯過任何新知識。