今天收到一份研討會的邀請函,主題是「突破資料備份的瓶頸」。內容是這樣寫的:
「企業面對爆炸性的資料增長、持續的備份窗口 (Backup Windows) 縮減要求與更多的法規遵循規範,既有的資料保護技術已不敷使用,並開始重新思尋更有效的解決方法。
重複資料刪除 (Data Deduplication) 是新一代資料保護解決方案採用的技術,可將備份資料集的大小縮小10-30倍以上,延長將備份保留在現場的時間,達到迅速的操作還原,並透過現有的災難還原網路連結及多站點磁帶整合,提供更有效率的易地備份複製。」
(下略)
好吧,資料備份面臨瓶頸,需要科技超人前來搭救。現今的資料處理的確面臨兩個問題,一是資料爆炸性的成長,二是備份窗口的時間變短。
資料爆炸性的成長
資料量成長實在太快,所以工程師們一直想要找到可以大幅縮減資料量的方法,市場專家們一直以為救星就是萬中選一的「資料壓縮技術」,結果當然不是。幾年前一家小公司發展出一個叫做「重複資料刪除技術」的小東西,市場一時驚為天人,各大廠商爭相採用,這家小公司就靠這個小東西成為上市公司,成為另一個萬中無一的矽谷傳奇。
重複資料刪除技術 (de-duplication) 實在很猛,可以將資料量縮小為10
~ 30倍,為了方便計算就取20倍好了,2
GB的資料大約可以縮減為100 MB。之前提過,一般中型規模以下的公司,每天產生的資料量經過de-duplication等技術處理後,很難超過100 MB,你想要備份/ 複製/ 拷貝/ 抄寫/ 克隆 這樣的資料量到世界任何一個地方,都變得輕而易舉。大企業的資料量也許是這個數字的20倍、50倍,但是隨著網路頻寬的成長與成本的降低,達成異地的資料即時複製,也不會有經濟與時效的問題。
備份窗口 (Backup Window) 的時間變短
備份窗口 (註) 是用於備份的時間區段,一般是晚上的12點開始到早上八點,公司早上9點一上班,就可以將備份資料存放妥當或是送到遠方保存。為了保證備份資料的一致與完整,所以備份過程必須持續不中斷。
曾經訪問過一家工廠,MIS跟我提到,原本的備份時段是晚上八點到隔日的早上八點,但是因為工廠的作業時間變長,所以備份時段改從午夜零點到早上七點,時間變短而資料量變多,若是七點沒有完成備份作業,必須停止備份,那麼昨日的備份就算報銷了。
由於工廠的輪班制與公司的延時加班,使得備份窗口可以利用的時段越來越短,而備份的資料量又大幅的成長,使得備份作業越來越困難,MIS常常被迫中止備份作業,未完成的備份無法使用,真是「為山千仞、功虧一簣」。
解決的方法還是從資料量的縮減著手。現在可以用上述的重複資料刪除技術,或是連續資料保護技術(CDP),或是差異區塊複製等等技術,來縮減資料量。如此就可以用更短的時間窗口,完成更多資料的副本。
舊式備份漸被取代
資料副本的微型化,以現有的網路頻寬,我們可以輕鬆的傳送副本到任何一個地方,可以是分公司,也可以是雲端資訊中心,可以是實體儲放的,也可以是虛擬存在的。新的科技突破了舊式資料備份的瓶頸,讓資訊管理人員放下重擔,以少做更多。科技總是推陳出新,取代舊科技只是時間的問題;汽車引擎如此耗油,電動引擎遲早會取而代之;舊式備份因為歷史的包袱,難免耗時繁瑣,時至今日,新的儲存與複製科技非常值得嘗試。
<註>
Wiki對於備份窗口Backup Window的說明,摘錄於下:
The
period of time when backups are permitted to run on a system is called the
backup window. This is typically the time when the system sees the least usage
and the backup process will have the least amount of interference with normal
operations. The backup window is usually planned with users' convenience in
mind. If a backup extends past the defined backup window, a decision is made
whether it is more beneficial to abort the backup or to lengthen the backup
window.