測試環境訓練好模型,正式上場預測前,我們會需要再建立一段R的評分程式碼,並且以字串的方式包在外部預存程序介面內(sp_execute_external_script),透過讀取序列化後的模型在R的環境執行預測。
但這樣的方式還是多了點麻煩,第一個是程式的可讀性,第二個則是正式環境的資料庫必需依賴R的環境作運算,要解決這個問題,也許可以試試看SQL2016就推出的Realtime評分(sp_rxPredict)或是SQL 2017推出的原生(Native)評分方式,更即時更原生的方式執行。
測試環境訓練好模型,正式上場預測前,我們會需要再建立一段R的評分程式碼,並且以字串的方式包在外部預存程序介面內(sp_execute_external_script),透過讀取序列化後的模型在R的環境執行預測。
但這樣的方式還是多了點麻煩,第一個是程式的可讀性,第二個則是正式環境的資料庫必需依賴R的環境作運算,要解決這個問題,也許可以試試看SQL2016就推出的Realtime評分(sp_rxPredict)或是SQL 2017推出的原生(Native)評分方式,更即時更原生的方式執行。
在執行異常偵測(abnormal detection)時,通常我們擁有大量的正常交易資料,但可能沒有足夠的不正常交易來讓機器學習,這個時候可以考慮單類別的SVM演算法(one Class-SVM)。很理想的,one Class-SVM隨著MicrosoftML套件也正式在R Server 9.0後可以在地面環境使用了(SQL Server 2017 CTP2),我們來試試。
R支援向量運算,可以大量減少程式內的迴圈使用,在計算統計分析中需要把資料結構拉成水平的去觀察,
筆記Lession 2: 向量運算。
R語言經常用在資料分析、統計及繪圖上,商業分析時除了學會問問題,還有一個很麻煩的地方是資料向量化(整齊),
去年4月微軟併購了企業級R語言的公司Revolution Analytics,今年地面上的SQL Server 2016也將開始支援R語言,
不久的將來,我們就可以正式把關聯式資料庫內已經整齊的資料丟進去跑演算法,更快的把結果顯示在客戶的電腦前面。
今天先來複習一下R 語言 Lession 1。