在同一個 LAN(區域網路)做同步與 HA 是比較容易的,因為在 LAN 裡面的網路頻寬比較大,網路管理與系統架設都比較容易。難是難在跨WAN(廣域網路)的同步與 HA,因為跨 WAN 可以使用的頻寬比較小,網路管理鞭長莫及,系統架設複雜的多,採購成本與頻寬費用也是不可忽視地問題!
傳統上,要做跨 WAN 的同步與 HA,系統一定要有幾個基本的能力:
1. 只需複製變更的資料:如果是整個檔案或整個硬碟都需要複製,傳輸的資料量太大,頻寬的需求太多,跨 WAN 一定是做不到的。
2. Block Level:實體傳輸的單位必定是 block。block 分子夠小,傳輸才夠快,又比較不會排擠到其他的網路傳輸。如果不是block level的系統,肯定做不到跨 WAN 的 HA。
3. 斷線續傳:假設 1G的資料需要傳輸,傳到 900M的時候 Internet網路突然中斷,一分鐘之後網路回復正常,但是必須重頭開始傳,這種系統無法支應跨WAN的同步需求。夠格的系統必須支援「斷線續傳」,就是在網路回復正常時,系統可以從901M的地方繼續傳送下去,系統才會夠效率夠、穩定。
看來,跨 WAN 的 HA 的問題,都鎖定在網路頻寬與穩定性的問題上。
MyMirror如果只能達到上述的三個傳統需求之外,就稱不上有什麼秘密可言!
傳統的思維邏輯,認為要做跨 WAN 的資料傳輸,終極解決辦法就是不斷的「壓縮」與「擠壓」,就是在有限的頻寬之下,將檔案壓縮到最小,再用力擠壓出最大頻寬,等資料到達彼岸的時候,再將資料釋放與解壓縮回來。就像公司請一個員工,鞭策他專心工作、努力加班而不求酬勞,短期可能可以,長期下來,這種方法一定是行不通的。
新的思維,是希望根本不需要傳輸,兩地的資料就能同步。做不到對不對!現在我們能夠做到的,是大量的減少傳輸的資料量,不需要的資料就不要傳輸,只要傳輸需要的資料就可以了,我們從傳輸資料的結構來處理跨 WAN 同步的問題。
MyMirror 可以跨 WAN 的秘密,是將需要傳輸的資料篩選到小之又小
傳統的備份是volume base,就是整個檔案卷冊(volume)都是需要被複製與被同步的對象,我們可以簡單的將volume base看做是將整顆硬碟的資料都需要做同步,假設硬碟的大小是100G。
MyMirror 的方法,是將需要傳輸的資料結構縮小,從 volume base 縮小為 directory base,MyMirror 可以依照不同的 directory(目錄,或稱資料夾),將資料同步到不同的地方。如下圖,我們將同步的基礎,從 volume 的 100G,縮小為 directory 的1G。網路所需傳輸的資料,頓時小了100倍。
MyMirror 其實還可以做到更小。MyMirror 是所謂 file based 的結構,有別於 database 與 volume based 的結構。MyMirror 實際是以 file 為基礎來傳輸資料。如上圖,MyMirror 可以只傳輸4M的檔案,資料量又小了256倍。
MyMirror其實還可以再做到更小!MyMirror的底層真正跑的資料單位是 block,MyMirror只需要傳輸變更過的區塊(block),主機端與備援端的資料就可以保持一致。圖中所示的4M的檔案實際只有52KB的資料被修改,所以只需同步52KB的異動資料即可。
要將資料跨WAN做即時同步,重點在資料的結構與資料量要減小,而不是將網路頻寬這條水管壓榨到最大,這種新思維可以突破以往的困境,這就是MyMirror可以支援LAN與WAN的秘密。
沒有留言:
張貼留言