SQL 2016在 TPC-H 測試中拿到第一名

SQL Server發展至今,已經連續在2015與2016二年都在Gartner魔力象限的右上角的領先地位,但是許多人都還不知道。來看看 SQL Server 的Data Warehouse 在 TPC-H的評比結果吧!

你一定很好奇!為何在上圖中SQL Server 包辦了前三名?而Oracle排名只有第8名。這是一個怎麼樣的測試呢?就是在4顆Intel Xeon E7處理器的單一伺服器上面去執行OLAP資料庫運算,SQL Server能以每小時1.6TB速度載入TPC-H架構,並且在5.3秒就能在100TB資料庫完成複雜查詢,令人驚豔!
而且在主流的四種高規格的伺服器都是一樣的結果,http://www.tpc.org/3325 ; http://www.tpc.org/3324 ; http://www.tpc.org/3317 ; http://www.tpc.org/3293


至於10TB這個級別的前8名分別是哪些品牌/版本的資料庫呢?




何謂 TPC Benchmark

若各位有遇過大型資訊系統的評估案,都會請軟體或硬體廠商提供 Sizing 資訊,如此才能精準地評估以下問題:
1. 資訊系統假設將應用在500個用戶的應用情境下,要用什麼品牌的伺服器?以及什麼樣的 CPU/RAM/HD規格下有比較好的效能?
2. 在最尖峰的時段這個資訊系統將處理多少Process或Thread?處理多少的連線請求?
3. 萬一資訊系統大受好評打算要擴大推廣,增加300個用戶需要增加多少的 CPU/RAM/HD規格?
4. 萬一資訊系統要升級版本,現有的 CPU/RAM/HD規格是否足夠?
5. 即使你費盡千辛萬苦完成了資訊系統的測試,也會被質疑你的系統配置是否以達最佳化?使用者的情境是否都有考量到?
6. 是簡易50筆瀏覽、新增、修改、刪除?還是能模擬線上交易、多人競價、訂單狀態更新…等情境?
以上的問題,實在太難回答,不要說是ERP,光是資料庫的就要花個十天半個月才有辦法回答老闆。所幸有一個 TPC組織可以幫助大家。

這是一個成立於1988年的非營利組織,致力於以公平公開公正的方式,對資料庫廠牌進行各種情境的效能評比,堪稱是資料庫產業的工業標準 Benchmark。
它針對不同硬體廠商以及其硬體組態(CPU/RAM/HD…),分別提供了不同的運算情境的工業標準評比方式,常見的包括:

  1. TPC-B:資料庫輸入輸出的標準,在交易記錄的完整性的前題下,測試應用程式執行時間。
  2. TPC-C:線上交易處理的標準,測試每分鐘交易處理的速度。
  3. TPC-D:資料庫查詢複雜性的標準,在複雜的 Table結構中,測試大量資料的查詢回應時間。
  4. TPC-E:與TPC-C 標準相同,但加入更複雜的資料庫架構與資料類型的應用情境。
  5. TPC-H:決策支援系統標準,模擬真實商業交易資料庫的動態查詢。

以下是 TPC 組織的官方說明,有助於我們更加了解這個評比的意義:
The TPC Benchmark H (TPC-H) is a decision support benchmark. It consists of a suite of business oriented ad-hoc queries and concurrent data modifications. The queries and the data populating the database have been chosen to have broad industry-wide relevance. This benchmark illustrates decision support systems that examine large volumes of data, execute queries with a high degree of complexity, and give answers to critical business questions.
The performance metric reported by TPC-H is called the TPC-H Composite Query-per-Hour Performance Metric (QphH@Size), and reflects multiple aspects of the capability of the system to process queries. These aspects include the selected database size against which the queries are executed, the query processing power when queries are submitted by a single stream, and the query throughput when queries are submitted by multiple concurrent users. The TPC-H Price/Performance metric is expressed as $/QphH@Size.


結論:SQL Server 2016 在TPC-H工業標準的效能評比下,在 10TB的大型資料量的級別中得到了第一名,真是令人興奮!

參考資料:
微軟部落格

李秉錡 Christian Lee
Once worked at Microsoft Taiwan