[TechDays 2010筆記] 資料庫可用性:SQL SERVER 高可用性及異地備援

摘要:[TechDays 2010筆記] 資料庫可用性:SQL SERVER 高可用性及異地備援

這個議題,對我來說一直都很有感覺,但在之前很多因素不能實現而有缺憾.

許致學老師這場提供,從SLA的角度來推演如何將企業系統作等級分類,並搭配HA的解決方案進行,使可納入BCP的運作規劃中,下文為摘要筆記與延伸分享

 

HA(High Availability) 高可用性 

確保在可接受的條件下持續運作,由系統的服務等級規範(Service Level Agreements, SLA)決定

SLA復原指標--

  • RTO (Recovery Time Objective)-停機復原時間
  • RPO ( Recovery Point Objective)-資料有多少損失

 

DR(Disaster Recovery)災難復原 

- 保護等級/ 地點

  • 本地HA-主機設備資源;不同建築物,小於15KM
  • 異地HA-網路中斷、機房損毀;小於150KM
  • 遠距異地DR-重大災害;大於150KM

 

 

企業應用系統的SLA應由企業主自行定義分類,筆者依經驗大約將應用系統的可用度等級作以下的分類(僅供參考):

  • 等級一: 企業資源規劃(ERP) 、顧客關係管理(CRM)、供應鏈管理(SCM)、 電子商務(EC) 等有與外部重要關連的資訊系統
  • 等級二:  高階主管資訊系統(SIS)、策略資訊系統(SIS)、工作流程管理系統(Workflow)等企業內部未與外部有必要關連的資訊系統
  • 等級三: 知識管理(KM)- 企業內部支援性系統,較無與流程決策有關的資訊系統

 

根據不同的RTO與RPO, SQL可提供的高可用度方案依冷備援、暖備援與熱備援來分類

 從SQL層級拉升到系統整體的商業持續運作規劃(BCP)時,大約有以下步驟可參考:

  1. 影響分析-系統關鍵功能,找出可能威脅,並依可用度等級將企業應用系統作分類,並考慮災害復原的保護等級
  2. 方案設計-依各種可能發生的威脅設計符合復原目標的方案,並評估費用與人力等資源
  3. 方案實作-部署與最佳實作方式
  4. 測試演練-測試演練是否符合復原目標
  5. 監控維護-日常/定期測試演練與reiview

 

企業應該要正視系統的BCP應該要怎麼作,以免災害一來只能期待前一天的備份帶還原,再加上不熟悉還原方式而造成企業人力空轉,那如果備份帶沒有用呢?? IT人員也不應該妄自菲薄,應該也要想著系統有問題電話接不完的窘境,那不如把企業IT全部外包給廠商好了...