案例情境:下載政府資料開放平台的「醫療機構與人員基本資料」,內為2019年全台灣醫療機構的清單,資料量約2萬2000多筆,用以模擬EXCEL的樞紐分析表,查出各縣市的醫療機構數量,並繪製成長條圖。
[R]讀取sav檔產生SPSS的KMO及Bartlett球形檢定
本文範例出處來自 俞洪亮等人(2012)「商管研究資料分析:SPSS的應用」,使用R語言來模擬SPSS報表產生的結果。
quality.sav檔內容為高鐵設施的意見調查(共175件樣本)、其問項因子有五:
- 高鐵車站的動線標示清楚 (X1 )。
- 高鐵車廂乾淨清潔 (X2 )。
- 高鐵服務人員服裝賞心悅目 (X3 )。
- 高鐵服務人員的態度輕切 (X4 )。
- 乘坐高鐵非常舒適 (X5 )。 •
以李克特5點尺度為量度(5為非常滿意,1為非常不滿意)。
[R]安裝Keras及Tensorflow套件進行功能測試
Keras為使用Python語言開發的神經網路套件,可透過各種資料集訓練開發者建立的深度學習模型,開發者操作API較容易上手,文件說明完整且方便查閱,但其缺點為容易於程式執行階段時,常產生成GPU記憶體溢位現象,也因此造成在存取資料集時,在使用大量內存的情況,使執行速度變得緩慢。其常用內建的資料集(DataSet)包含:(本文使用MNIST資料集進行測試)
- CIFAR10:小型圖像
- IMDB:電影評論分類
- MNIST:手寫數字集
- Fashion-MNIST:時尚品項資料
- Boston:房價回歸資料
Tensorflow也是一套由Google發佈的的機器學習框架,使用python及C++語言開發而成,支援多種程式語言,業界主要用於文字、語音、圖片、影片等媒體媒體格式的辨識處理,本文就直接在R開發環境使用Tensorflow套件。
[R]讀取sav檔產生SPSS的相關矩陣表
本文範例出處來自 俞洪亮等人(2012)「商管研究資料分析:SPSS的應用」,使用R語言來模擬SPSS報表產生的結果。
[R]讀取sav檔產生SPSS的敘述統計表
本文範例出處來自 俞洪亮等人(2012)「商管研究資料分析:SPSS的應用」,使用R語言來模擬SPSS報表產生的結果。
[R]讀取外部csv檔加入資料集並檢視結果
本案例安裝的套件有gdata , RCurl 進行 csv檔的讀取
- gdata、gtools:使用read.xls()或read.csv()進行檔案格式讀取。
- RCurl:使用getURL()來取得csv檔的網址內容。
情境:使用R程式檢查本機的csv檔是否存在,若有則顯示其內容,若無則讀取遠端csv資料,並顯示於data editor上
[R]使用ggplot2套件進行資料的簡單相關分析
於專案中使用install.package來安裝ggplot2,並將套件載入,使用R語言內建的iris(鳶尾花資料集)進行皮爾森積差相關分析並產生散佈圖。
相關分析解讀要點:
- 相關係數介於-1(負相關)至1(正相關)之間
- 相關係數沒有單位
- 兩數列有相關,並不表示有因果關係
- 從ggplot2產生的散佈圖中,兩數列若呈現線性關係,則表示有相關聯性
[R]常用亂數函數的數組產生測試
R的亂數函數測試
[R]載入並呼叫外部R程式裡的function
本文內容:
- 設計一個外部的R檔案,是給主程式存取的的共用function
- 於主程式中匯入該R檔案,存取其function內容。
[R]例外處理的常用寫法
R的例外處理:本範例設計了一個function,內部使用tryCatch函數,用來處理型態轉換產生的問題,進行測試。
[R]常用的向量類別與資料存取方式之整理
本文是擷取其他網路上R的向量相關的method及使用方式,包含:
- 因子方法
- 資料框架
- 集合
[R]於Visual studio code上設定R語言的開發環境
簡易說明:
- 安裝R軟體程式及Visual studio code
- 修改task.json檔案(設定R套件的執行路徑)
- 編寫R程式,執行除錯
- 1