[R]安裝Keras及Tensorflow套件進行功能測試

Keras為使用Python語言開發的神經網路套件,可透過各種資料集訓練開發者建立的深度學習模型,開發者操作API較容易上手,文件說明完整且方便查閱,但其缺點為容易於程式執行階段時,常產生成GPU記憶體溢位現象,也因此造成在存取資料集時,在使用大量內存的情況,使執行速度變得緩慢。其常用內建的資料集(DataSet)包含:(本文使用MNIST資料集進行測試)

  • CIFAR10:小型圖像
  • IMDB:電影評論分類
  • MNIST:手寫數字集
  • Fashion-MNIST:時尚品項資料
  • Boston:房價回歸資料

Tensorflow也是一套由Google發佈的的機器學習框架,使用python及C++語言開發而成,支援多種程式語言,業界主要用於文字、語音、圖片、影片等媒體媒體格式的辨識處理,本文就直接在R開發環境使用Tensorflow套件。

...繼續閱讀 »

[R]讀取外部csv檔加入資料集並檢視結果

本案例安裝的套件有gdata , RCurl 進行 csv檔的讀取

  • gdata、gtools:使用read.xls()或read.csv()進行檔案格式讀取。
  • RCurl:使用getURL()來取得csv檔的網址內容。

情境:使用R程式檢查本機的csv檔是否存在,若有則顯示其內容,若無則讀取遠端csv資料,並顯示於data editor上 

...繼續閱讀 »

[R]使用ggplot2套件進行資料的簡單相關分析

於專案中使用install.package來安裝ggplot2,並將套件載入,使用R語言內建的iris(鳶尾花資料集)進行皮爾森積差相關分析並產生散佈圖。

相關分析解讀要點:

  • 相關係數介於-1(負相關)至1(正相關)之間
  • 相關係數沒有單位
  • 兩數列有相關,並不表示有因果關係
  • 從ggplot2產生的散佈圖中,兩數列若呈現線性關係,則表示有相關聯性
...繼續閱讀 »