摘要:[TechDays 2010筆記] 資料庫可用性:SQL SERVER 高可用性及異地備援
這個議題,對我來說一直都很有感覺,但在之前很多因素不能實現而有缺憾.
許致學老師這場提供,從SLA的角度來推演如何將企業系統作等級分類,並搭配HA的解決方案進行,使可納入BCP的運作規劃中,下文為摘要筆記與延伸分享
HA(High Availability) 高可用性
確保在可接受的條件下持續運作,由系統的服務等級規範(Service Level Agreements, SLA)決定
SLA復原指標--
- RTO (Recovery Time Objective)-停機復原時間
- RPO ( Recovery Point Objective)-資料有多少損失
DR(Disaster Recovery)災難復原
- 保護等級/ 地點
- 本地HA-主機設備資源;不同建築物,小於15KM
- 異地HA-網路中斷、機房損毀;小於150KM
- 遠距異地DR-重大災害;大於150KM
企業應用系統的SLA應由企業主自行定義分類,筆者依經驗大約將應用系統的可用度等級作以下的分類(僅供參考):
- 等級一: 企業資源規劃(ERP) 、顧客關係管理(CRM)、供應鏈管理(SCM)、 電子商務(EC) 等有與外部重要關連的資訊系統
- 等級二: 高階主管資訊系統(SIS)、策略資訊系統(SIS)、工作流程管理系統(Workflow)等企業內部未與外部有必要關連的資訊系統
- 等級三: 知識管理(KM)- 企業內部支援性系統,較無與流程決策有關的資訊系統
根據不同的RTO與RPO, SQL可提供的高可用度方案依冷備援、暖備援與熱備援來分類
從SQL層級拉升到系統整體的商業持續運作規劃(BCP)時,大約有以下步驟可參考:
- 影響分析-系統關鍵功能,找出可能威脅,並依可用度等級將企業應用系統作分類,並考慮災害復原的保護等級
- 方案設計-依各種可能發生的威脅設計符合復原目標的方案,並評估費用與人力等資源
- 方案實作-部署與最佳實作方式
- 測試演練-測試演練是否符合復原目標
- 監控維護-日常/定期測試演練與reiview
企業應該要正視系統的BCP應該要怎麼作,以免災害一來只能期待前一天的備份帶還原,再加上不熟悉還原方式而造成企業人力空轉,那如果備份帶沒有用呢?? IT人員也不應該妄自菲薄,應該也要想著系統有問題電話接不完的窘境,那不如把企業IT全部外包給廠商好了...