[R]使用ggplot2套件進行EXCEL資料分析繪製長條圖-以醫療機構與人員基本資料為例

案例情境:下載政府資料開放平台的「醫療機構與人員基本資料」,內為2019年全台灣醫療機構的清單,資料量約2萬2000多筆,用以模擬EXCEL的樞紐分析表,查出各縣市的醫療機構數量,並繪製成長條圖。

...繼續閱讀 »

[R]讀取sav檔產生SPSS的KMO及Bartlett球形檢定

本文範例出處來自 俞洪亮等人(2012)「商管研究資料分析:SPSS的應用」,使用R語言來模擬SPSS報表產生的結果。

quality.sav檔內容為高鐵設施的意見調查(共175件樣本)、其問項因子有五:

  • 高鐵車站的動線標示清楚 (X1 )。
  •  高鐵車廂乾淨清潔 (X2 )。
  • 高鐵服務人員服裝賞心悅目 (X3 )。
  • 高鐵服務人員的態度輕切 (X4 )。
  • 乘坐高鐵非常舒適 (X5 )。 •

以李克特5點尺度為量度(5為非常滿意,1為非常不滿意)。

 

...繼續閱讀 »

[R]安裝Keras及Tensorflow套件進行功能測試

Keras為使用Python語言開發的神經網路套件,可透過各種資料集訓練開發者建立的深度學習模型,開發者操作API較容易上手,文件說明完整且方便查閱,但其缺點為容易於程式執行階段時,常產生成GPU記憶體溢位現象,也因此造成在存取資料集時,在使用大量內存的情況,使執行速度變得緩慢。其常用內建的資料集(DataSet)包含:(本文使用MNIST資料集進行測試)

  • CIFAR10:小型圖像
  • IMDB:電影評論分類
  • MNIST:手寫數字集
  • Fashion-MNIST:時尚品項資料
  • Boston:房價回歸資料

Tensorflow也是一套由Google發佈的的機器學習框架,使用python及C++語言開發而成,支援多種程式語言,業界主要用於文字、語音、圖片、影片等媒體媒體格式的辨識處理,本文就直接在R開發環境使用Tensorflow套件。

...繼續閱讀 »

[R]讀取外部csv檔加入資料集並檢視結果

本案例安裝的套件有gdata , RCurl 進行 csv檔的讀取

  • gdata、gtools:使用read.xls()或read.csv()進行檔案格式讀取。
  • RCurl:使用getURL()來取得csv檔的網址內容。

情境:使用R程式檢查本機的csv檔是否存在,若有則顯示其內容,若無則讀取遠端csv資料,並顯示於data editor上 

...繼續閱讀 »

[R]使用ggplot2套件進行資料的簡單相關分析

於專案中使用install.package來安裝ggplot2,並將套件載入,使用R語言內建的iris(鳶尾花資料集)進行皮爾森積差相關分析並產生散佈圖。

相關分析解讀要點:

  • 相關係數介於-1(負相關)至1(正相關)之間
  • 相關係數沒有單位
  • 兩數列有相關,並不表示有因果關係
  • 從ggplot2產生的散佈圖中,兩數列若呈現線性關係,則表示有相關聯性
...繼續閱讀 »