迅速發(fā)展的法國云計算提供商OVH公司美國市場正在積極追趕亞馬遜和微軟等巨頭,并計劃關(guān)閉和拆卸法國斯特拉斯堡園區(qū)的三個數(shù)據(jù)中心中的兩個數(shù)據(jù)中心,然而在11月10日卻造成了長時間的客戶應(yīng)用程序中斷,中斷持續(xù)了一整天,直到晚上才恢復(fù)。
在斯特拉斯堡園區(qū)停電大約40分鐘之后,OVH公司位于法國魯貝(Roubaix)的大一個數(shù)據(jù)中心的網(wǎng)絡(luò)連接失去了六個關(guān)鍵網(wǎng)絡(luò)接入點,其位置距斯特拉斯堡園區(qū)約500公里。OVH公司創(chuàng)始人兼首席執(zhí)行官Octave Klaba說,這個網(wǎng)絡(luò)中斷事件與斯特拉斯堡數(shù)據(jù)中心中斷事件無關(guān),是由光纖網(wǎng)絡(luò)設(shè)備軟件錯誤引起的。
OVH公司位于法國斯特拉斯堡園區(qū)的SBG1集裝箱數(shù)據(jù)中心
這個令人尷尬的事件是該公司的一個重大挫折??偛课挥隰斬惖腛VH公司近期獲得了巨大的發(fā)展動力,獲得了新的財務(wù)支持,并擴(kuò)展到歐洲和北美地區(qū)的新市場。今年早些時候,它收購了VMware公司的公共云業(yè)務(wù),并宣布在美國俄勒岡州建設(shè)一個數(shù)據(jù)中心,并在弗吉尼亞州的雷斯頓新建一個辦事處。它還在弗吉尼亞州的Vint Hill建設(shè)了一個數(shù)據(jù)中心,離雷斯頓不遠(yuǎn)。OVH公司已經(jīng)在蒙特利爾市場建設(shè)運營了一個數(shù)據(jù)中心。
OVH公司創(chuàng)始人兼首席執(zhí)行官Octave Klaba隨后在一篇詳細(xì)的博客文章中寫道:“這可能是我們發(fā)生的最糟糕的情況。”在這個博客文章中,他還描述了準(zhǔn)備關(guān)閉使用集裝箱建造的兩個斯特拉斯堡數(shù)據(jù)中心,并決定縮短拆解的施工時間。
Klaba表示,“即使這個事件是由第三方廠商的設(shè)備所造成的,我們也不能否認(rèn)自己的責(zé)任。我們在SBG集裝箱數(shù)據(jù)中心開展了一些工作來達(dá)到與其他OVH數(shù)據(jù)中心相同的標(biāo)準(zhǔn)。
11月10日,斯特拉斯堡園區(qū)停電3.5小時,但是OVH公司的員工花費很多時間重新啟動服務(wù)器并恢復(fù)應(yīng)用程序。OVH公司自己構(gòu)建的許多服務(wù)器顯然都經(jīng)歷了由于中斷而導(dǎo)致的硬件故障。來自魯貝的一輛運送配件的卡車來到了斯特拉斯堡,工作人員在那里更換部件并啟動服務(wù)器,一直工作到深夜。
OVH公司的Roubaix數(shù)據(jù)中心網(wǎng)絡(luò)連接恢復(fù)正常比較容易,花費的時間也較少,但其影響范圍廣泛。這個數(shù)據(jù)中心園區(qū)網(wǎng)絡(luò)連接巴黎,法蘭克福,阿姆斯特丹,倫敦和布魯塞爾的網(wǎng)絡(luò)PoP,這些城市都是歐洲最重要的網(wǎng)絡(luò)互聯(lián)樞紐。
Klaba說,雖然把錯誤歸咎于沒有提到的光網(wǎng)絡(luò)設(shè)備供應(yīng)商,但是OVH最終還是因為沒有過多的追究。
Klaba說,“我們將與OEM廠商合作,找出問題的根源,并幫助解決問題。我們不懷疑設(shè)備制造商的產(chǎn)品,即使這種類型的缺陷是特別關(guān)鍵。正常運行時間是一個設(shè)計問題,必須考慮到每一個可能性。OVH公司必須確保比它設(shè)計的每個系統(tǒng)更加可靠。”
Klaba所提到的第三方廠商的自動化故障是斯特拉斯堡園區(qū)的電力故障轉(zhuǎn)移系統(tǒng)切換到發(fā)電機(jī)供電時發(fā)生故障。Klaba表示,OVH公司經(jīng)常對故障轉(zhuǎn)移系統(tǒng)進(jìn)行測試,而最近在今年5月進(jìn)行的一次測試沒有發(fā)生任何問題。
但他承認(rèn),OVH公司在基礎(chǔ)設(shè)施設(shè)計方面可以做得更多,以避免這次的電力中斷事件。整個數(shù)據(jù)中心由一條20kV的公共饋電線饋電,而沒有采用通常來自兩個獨立電網(wǎng)的冗余饋電的標(biāo)準(zhǔn)慣例。
Klaba表示,OVH為其他數(shù)據(jù)中心園區(qū)的個別數(shù)據(jù)中心使用冗余的電力傳輸和獨立的電網(wǎng),但在斯特拉斯堡園區(qū)兩個數(shù)據(jù)中心(SBG1和SBG2)卻只采用同一個電網(wǎng)的電力。
Klaba解釋說,該公司開發(fā)了基于集裝箱的數(shù)據(jù)中心設(shè)計,實際上將集裝箱彼此堆放在一起,而不是采用傳統(tǒng)建筑的數(shù)據(jù)中心,通過避免獲得建筑許可證相關(guān)的時間限制來加速部署。這也是一個加快數(shù)據(jù)中心部署的測試,再投入一個新的市場,測試成功后,然后再進(jìn)行大規(guī)模的投資。
SBG1數(shù)據(jù)中心是由八個集裝箱組建成斯特拉斯堡的第一個數(shù)據(jù)中心,經(jīng)過不到兩個月的安裝部署工作,于2012年上線運營。隨著數(shù)據(jù)中心市場需求日益旺盛,于是OVH公司在2016年建成了非集裝箱式SBG2數(shù)據(jù)中心,采用“塔式”設(shè)計,并開始建設(shè)第三個數(shù)據(jù)中心SBG3.
然而,在建設(shè)SBG2數(shù)據(jù)中心之前,由于OVH公司正在努力滿足斯特拉斯堡的市場需求,2013年,OVH公司在這里建立了第二個集裝箱數(shù)據(jù)中心SBG4.
現(xiàn)在,OVH公司為節(jié)省時間和資金而迅速部署產(chǎn)能的決定已經(jīng)引起了極大的反響,決定投入200萬到300萬歐元,為數(shù)據(jù)中心園區(qū)安裝部署第二套電力設(shè)施,并將客戶從集裝箱數(shù)據(jù)中心遷到SBG3數(shù)據(jù)中心,關(guān)閉并折卸集裝箱數(shù)據(jù)中心。