進擊的巨人 SQL 2019

SQL2019 像個巨人,連國外證交所的即時搓合,這類的海量交易也難不倒它。在職涯中,你或許曾經有跨過幾個不同的版本,但是安裝的過程太順利!在幾個下一步+下一步就結束了,根本感覺不出來這個超過 30歲的 SQL Server強在什麼地方?殊不知,在資料庫的戰場中,每天至少都有上百個產品在撕殺,大家在 OLTP上比效能比市佔率;在 OLAP上比Cube/Tabular模型比Column stored index;在 Big data上比對海量資料的支援比對非結構化資料的支援;在 AI上,比演算法比分散式運算。另外,由於每個人的工作職掌不同,本文還會從使用情境、效能、預算的角度,帶大家一起來探討如何挑選適合的版本?

...繼續閱讀 »

什麼是SQL Server vNext ?

自從2017年微軟在SQL Server產品上推出了Version Next,意圖透過 EAP(Early Adoption Program)這個計劃,讓客戶與合作夥伴在產品上市之前,客戶可以一賭為快;合作夥伴可以透過創新功能開發自己的產品,贏得更大的商機!
包含了SQL2017首次可以進行在非微軟Windows作業系統上面進行;以及SQL2019可以在微軟NTFS檔案系統之外的HDFS,同時享受傳統IT環境與巨量資料Spark(Hadoop的下一代)的Hybrid 優勢。

...繼續閱讀 »

Market Basket Analysis with SQL Server ML Services

接續 GLM(General Linear Model)與預防性維修,本篇要來介紹西元2000年最讓人津津樂道的購物籃分析(啤酒與尿布)關聯規則(APRIORI)演算法,這是一個要學產品推薦的建議起手式,尤其是在電商百家爭鳴的時代。此次的環境還是用到了Azure上的VM template,其版本為 SQL Server 2017(R3.3.3)

...繼續閱讀 »

GLM prediction with SQL Server ML Services

自 SQL Server 2016推出 R服務之後,Revolution團隊在SQL 2017版本中,除了將原先的服務改名為 Machine Learning Services(為了納入對 Python語言的支援),更強化了對 R語言的支援與 Pre Training model的數量。本篇將簡單地介紹 R語言的語法,以及會用GLM 一般線性模型(可歸類為廻歸分析)來示範,讓熟悉 T-SQL的 DBA也能用 SQL Server做機器學習

 

...繼續閱讀 »

SQL Server Data Mining

Dot com 電子商務在西元2000年時達到的巔峰,資料採礦(Data Mining)更是打蛇隨棍上,藉由這股熱錢在產業中快速地掘起。微軟也是由 SQL Server 2000 開始支援資料採礦的功能,並且在 SQL Server 2005 增加了更多的演算法。基礎於微軟定位自己是一個平台供應商,在自己不是演算法的供應商的情況下,主導這個市場的能力有限。所幸在2015年買下了 Revolution Analytics,終於解鎖了這個限制,讓企業的想像力可以盡情的奔馳…

...繼續閱讀 »

SQL 2016 Stretch database-2

延展資料庫 Stretch database 是SQL2016 開始提供一腳在雲端一腳在地端的的混合雲的資料庫解決方案,尤其針對地端空間或是運算能力不足的情境特別能夠派上用場。目前已經成功地應用在全世界的政府以及民間各種產業,解決外部稽核時硬體調度的困難、金融業重要交易資料的混合雲建置(又要符合法規的冗長保存期限又要防止磁帶還原失敗的風險)、政府重要政策資料的混合雲建置(又要兼具便民的隨時查詢需求又要解決線上資料庫的空間不足)、ISV廠商不須要變更查詢或應用程式即可移動資料而且延展資料在雲端會自動備份降低管理複雜性、維運部門夜間資料庫備份因為DB太大(為了遷就許多偶爾才會被查詢的歷史資料)常常備份失敗…等惱人問題

...繼續閱讀 »

SQL Server 2017 R入門

SQL Server發展至今30年,微軟一直致力在提供客戶最新的功能。在SQL2016時甚至買下企業版的R,讓關聯性資料庫可以有更強的進階分析能力,也讓一直引頸期盼演算法更新的企業客戶(例如設有 data mining 分析部門的客戶族群)可以一展笑顏。在SQL2017中專業的R團隊,除了讓二邊的整合更加流暢,還多增加了對 Python的整合,強化了SQL Server對於AI的進階分析功能

...繼續閱讀 »