早上9:30,快遞公司人員準時出現在保險公司總部的櫃台,他每天固定準時來領取兩份包裹,一份送到5公里外的本地分公司,另一份送到100公里外另一個城市的分公司。兩個包裹裡裝的是一模一樣的東西 --- 昨天營運資料的備份磁帶。
當總部的電腦當機或資料毀損時,本地分公司的磁帶就派上用場了,可以在4小時內讓電腦系統重新上線營運;當火災、地震、洪水、海嘯等天災發生的時候,
100公里外異地分公司的磁帶就派上用場了,可以在24 ~ 48小時內讓電腦系統重新上線營運。
這就是企業以前的備份體系,本地一份,異地一份。
時到今日,我們為什麼還要將同樣一份資料抄寫兩次,坐兩趟汽車,送到兩個地方,跟其他364天的磁帶卷堆放在一起。
一次就夠了!備份 (backup) 的觀念已經落伍了,我們現在需要的是複製 (replication)。
現在,我們有更好的網路頻寬和新的儲存技術,讓我們可以更直接、更快速、更即時、更有效率的複製更新過的資料到全世界任何地方。科技進步了,我們有足夠的技術將資料量縮減到非常之小,一些基於資料區塊 (block) 的儲存與傳輸方式可以大量減少複製的資料量,硬碟裡只有被更新過的資料區塊需要被傳輸,而de-dupe重複資料刪除技術可以將資料量縮減到20分之1,網路也有很好的壓縮傳輸科技。我們可以挑選單獨一種,或綜合上述幾種篩揀、刪除、與壓縮的技術來預先處理資料,大部分的企業每天產生的差異資料量都小於500 MB,甚至可以說小於100 MB,一般的網路頻寬就可以輕易地、即時地處理這幾百MB的資料傳輸。
我們只要透過網路將資料複製到遠端一次就可以了,時效急迫可以做即時的複製,時效寬裕可以做延遲的複製,完全沒有壓力。現在,電腦硬碟裡的資料只需要拷貝一次,而不用兩次三次,是不是讓人輕鬆愉快多了。
備份 (backup) 還有其他問題,製作兩三個備份分別放置在不同的地方,會造成資訊洩漏的安全問題,這足以讓企業倒閉。
備份的另一個問題是資料格式不同,備份的副本都是束諸高閣、「備而不用」。一旦災難發生,資料復原需要幾個小時到幾天的時間,這樣的時效不是現代的企業或是客戶可以接受的。
備份還有一個終極的問題,就是沒有人可以保證,備份的資料是否完整無缺而且確實可用。
複製 (replication) 就和藹可親多了,複製到異地的資料格式可以是相同的,可以立刻被取用的,所以複製過的副本是「既備且用」,這相當於負載平衡的功能,讓異地的副本確實可用的,異地的電腦設備也不會閒置無用。因此,用複製來取代備份,不僅達成原本資料異地備份的基本目標,更具有資料分散部署與負載平衡的高階能力。
而且,異地的電腦設備既可以上線,資料又能即時傳輸到位,所以無論是本地的主機或是異地的備援機都呈現工作的狀態。若是主機因為人為或天災而不能工作的時候,系統服務就自動轉移到備援機上,如此,資訊服務將不會停頓。因此,用複製來取代備份,不僅做到資料備援的基礎,更是系統備援的基礎。
最後,不要忘了雲端!把資料複製到雲端儲存設備,更簡單更經濟。忘記備份吧,讓我們擁抱複製。
<註>
科技名詞的意義雖專業卻往往界線模糊,為了討論的專注與避免誤會,先將幾個相關的專有名詞定義清楚:
- Backup: 備份,備而不用的副本。非即時性的副本製作,大部分是指排程式的資料抄寫 (scheduled backup),時間性較不急迫。維基百科提到:最好將重要資料製作三個,或三個以上的備份,並且放置在不同的場所,以利日後回存之用。Backup副本的資料格式,通常都與正本的資料格式不同。
- Replication: 複製,備而可用的副本。即時性的副本製作,時間性比backup簡短快速。Replication正副本的資料格式相同。
- Synchronization: 同步。同一時間抄寫完成的資料正本與副本。時間性最為緊湊。
- Copy: 副本。動詞做抄寫。用copy來製作副本,跟即時性、時間性等沒有關係。
- Duplicate: 完全一樣的副本。
- Redundancy: 贅餘的副本。平常備而無用,意外發生時才啟用的副本。
- Clone: 克隆,一模一樣的複製品。無性繁殖。
沒有留言:
張貼留言