K書筆記本-Operations Security(03)

對於伺服器在各項Redundant的設計中,尤其是在於power、Disk Array,是針對Operation的可用性提高可用的彈性,
而對磁碟陣列的規劃中,各家想法不同,例如對於檔案伺服器在有限的資金下,希望做到系統高可用度與資料磁碟備援,
以最少的資金規劃,又不希望系統的效能太差,那麼系統碟用2顆硬碟做RAID 1,資料碟則以3顆硬碟做RAID5,若預算夠的話 …

對於伺服器在各項Redundant的設計中,尤其是在於power、Disk Array,是針對Operation的可用性提高可用的彈性,而對磁碟陣列的規劃中,各家想法不同,例如對於檔案伺服器在有限的資金下,希望做到系統高可用度與資料磁碟備援,以最少的資金規劃,又不希望系統的效能太差,那麼系統碟用2顆硬碟做RAID 1,資料碟則以3顆硬碟做RAID5,若預算夠的話,當然最好是用四顆硬碟做RAID 5,以提高其可用性,當然多的這顆硬碟就是做Hot Spare,若是資料庫伺服器呢?
對企業而言是極重要的資產,系統碟以RAID 1 做為備援考量,而存資料庫實體檔案以最高可投入的資金考量,則可規劃建置RAID 1 + 0 (不是0+1喔!)。

而上面提到的Hot Spare,多數都只認為是一種自動替換損壞硬碟的措施,但是,對於儲放在伺服器上的資料,還是有分重要與不重要,若今天資料碟與系統碟都損壞了,那麼只有一顆hot spare,到底是要替換掉資料碟還是系統碟呢?若是在Global hot spare則是誰先壞,就先行替代,而若將hot spare設定成為Dedicated hot spare,那麼,就可以把這顆備用的硬碟指定給特定的RAID做切換,是可以避免重要的資料碟的hot spare被系統碟的RAID給用掉了。
其它的備份類型像是File Image(一般的備份像ghost,若是用於電腦犯罪,則必須以bit to bit的備份方式)、Data Mirroring(類似RAID1)、Electronic Vaulting(非即時)、Remote Journaling(非即時)、Database Shadowing(可避免資料遺失)、Redundant Servers/Standby Services(Faile-Over)

都是針對故障容錯的保護,一般都是應用在硬體故障之上,主要的目的都是為了自動的矯正錯誤的措施,但對於錯誤的認定也是一個要素,為了避免誤判對於失效的容許而言,才是最重要的依據,因此對於每個容錯的機制都有其門檻值,只要低於門檻值,則該設備則會被判斷失效,如此的設計是為了讓系統更穩定,而不是讓系統人員更忙,因此在判斷錯誤的部份必須是精準且有效的。

在安全的領域包含連系統復原(System Recovery)的信任復原(Trusted Recovery)都是基於信任電腦基礎(Trusted Computer Base),任何的復原共分為三種:
System Reboot(系統重啟): 是系統自我執行修復的狀態,讓系統的運作維持一致的狀態。
Emergency System Restart(緊急系統重啟): TCB的修復失效後,人為的修複,當系統進入維護模式後TCB自行修復並回復一致性。
System Cold Start(系統冷開機): 與上者不同處是必須完全的進行人為的修復,並且手動的修復、回復一致性。

即然有失效的問題,那麼就應該避免失效所造成的資訊安全問題,因此,對於設備失效時會不會造成資訊外洩,因此對於安全的保護就成了必要的措施,Fail Secure:又稱為Fail Close,也就是當設備的狀態出現錯誤,那就必須呈現鎖定,並禁止任何動作(像Firewall)。
Fail Safe: 又稱為Fail Open,也就是當設備的狀態出現錯誤,就呈現通行的狀態,並不會禁止任何運作(像IDS),這個觀念應用在實體安全上,就像是門的控制,當有人強行的將門打開,那麼防火門馬上就會啟動,將所有的門窗關閉,將入侵者關在內部,但若是機房發生火災,那麼馬上就會關閉HVAC,並且打開消防保護,而門就會呈現不鎖定的狀態以便讓人員由內而外的脫逃。

即然有失效的問題產生,那麼,也會有事故處理程序了,就有如事件的通報譬提升處理的程序一樣,是第一線的防禦,雖然事故的處理是較被動的,但透過記錄(Logging)、追縱(tracking)及分析(Analysis),並透過以上的程序進而得到分析,系統是否在未來可能遇到的事故,因此成立Incident Response Team(IRT)是可以有效的控制事故,這個過程又回到了BCP中所提的Continency Plan(意外事件計劃), 因此IRT所負責的範圍可不小呀!

IRT要處理的包括有System Failure、Denial of Service(DoS)、Tampering or Intrusions(竄改或入侵)、Production Delay(產線延遲)、I/O Error(輸出/入誤),由此可知,IRT的內容有多少的事故要處理,因此IRT的組成必須涵蓋企業內的所有部門相關人員,不論是由商業的角度來看操作,或者是IT類的事故操作,因此對於IRT的相關內容,請大家參閱BCP&DRP章節。
而後續與IRT更精采的介紹會在Legal, Regulations, Compliance, and Investigations中跟大家一起討論。


Anything keeps Availability.
Anywhere keeps Integrity.
Anytime keeps Confidentiality.
keep A.I.C. = Information Security