Python 機器學習
Python 作為機器學習的主流程式語言,相關計算及資料分析的函式庫也很多,以下是常用參考資料來源整理。
Python
Python 是其中一個使用於機器學習上的程式語言,加上在平行運算以及科學計算領域的應用,被使用得相當廣泛。
Anaconda
是一個可用於 Linux、OS X 和 Windows 上的 Python 平台環境,整理有相當完整的機器學習所需的組件。
例如 numpy、scikit-learn 和 matplotlib,以及 Jupyter Notebook - iPython。
機器學習
機器學習所需學習領域相當廣泛,需要長時間的實際開發,才能逐漸了解並演算法的各種方法的適用性及其深度應用。
而對於程式設計師來說,學習機器學習各種函式庫的使用方法,比較出怎麼應用會得到比較好的效果,卻不一定需要深度的瞭解演算法理論。
函式庫
Python 有許多機器學習函式庫支援:
- Numpy:提供 N 維度的陣列物件,並支援平行運算。
- Pandas:提供 dataframess 一個具有容錯性的資料結構。
- Matplotlib:提供相當齊全的統計圖表函式庫。
- Seaborn:資料視覺圖表函式庫。
- Scikit-learn:提供多種資料採礦及機器學習演演算法的函式庫。
iPython (Jupyter) Notebook
一個互動式的 Web IDE 程式編輯環境,也支援 R 語言編輯。
機器學習
試著了解一些常用的演算發,會更容易理解函式庫的使用方式。
深度學習
深度學習建立在幾十年前的人工神經網路基礎上,但是最近較大的進步大致起於 2015 年,演算法的進步大幅提高了神經網路的學習能力。
參考資源
KDnuggets 有大量的文章詳細介紹機器學錫與深度學習。