
美國當?shù)貢r間4月21日早晨,位于北弗吉尼亞州的亞馬遜EC2、RDS 服務(wù)器出現(xiàn)了技術(shù)問題,導(dǎo)致網(wǎng)絡(luò)延遲及鏈接錯誤。亞馬遜的此次“云端”技術(shù)故障導(dǎo)致多個知名應(yīng)用出現(xiàn)大規(guī)模停頓。受害者包括:Foursquare,Quora,HootSuite,Reddit。
我將這次技術(shù)故障稱為:云震,云端大地震。
IDC 的分析師 Matthew Eastwood 說:“這是對云計算的一次特別提醒?!痹普鹗菍υ朴嬎憷砟畹囊淮尉?。以往云所宣稱的“永不宕機的可靠性”其實只是一種期望。
簡單的去理解云,它是一種以最終計算能力和存儲能力為產(chǎn)品的信息服務(wù),和以往機房提供的服務(wù)不同,客戶無需關(guān)心計算能力和存儲能力的由來。然而這項服務(wù)的根基仍然是機房服務(wù)??蛻艨梢圆魂P(guān)心云的運營,然而將這個概念擴展到“任何人無需關(guān)心云的運營”就不可取了。今天亞馬遜關(guān)心的不到位,就要客戶和終端用戶為這樣的不到位買單。
針對“云不是完美的”這項事實,全球的信息專家發(fā)出了各種設(shè)想,意在云震之后完善這個理念,讓各種服務(wù)繼續(xù)飄在云端。
分布式的云
Netflix是亞馬遜云服務(wù)的重要客戶,在此次云震中他們幸免于難。Netflix 的發(fā)言人 Steve Swasey 表示:我們充分利用了亞馬遜的冗余云架構(gòu),任何發(fā)生在單點的技術(shù)問題不會影響 Netflix 的業(yè)務(wù)。
將產(chǎn)品部署到地理位置更廣泛的云端去,同時啟用幾片云而不是一片云。是云震求生的第一條技能。
快速恢復(fù)
BigDoor是本次云震中另一個快速恢復(fù)服務(wù)的公司??偛?Keith Smith 說:由于購買了亞馬遜的備份恢復(fù)服務(wù),我們很快恢復(fù)了過來。不過這個服務(wù)只在弗吉尼亞數(shù)據(jù)中心才有。當然公司需要在費用和可靠性中尋求一個平衡點。
快速恢復(fù)也許現(xiàn)在的價格很高,但比起丟失用戶體驗,這些錢值得放進創(chuàng)業(yè)規(guī)劃中去。
陰謀論
此次云震的最大受害者是誰?亞馬遜云端上的那些創(chuàng)新企業(yè)。今天,已經(jīng)有大量創(chuàng)新企業(yè)建筑在大公司提供的低廉的云端上。
會不會有天,當你不聽話了:搶掉了大公司的用戶,或者不同意某項由大公司股東提議的收購,接著,你的那片云就崩了。
云可能成為大公司談判的資本,云也有可能成為大公司操縱市場運作的籌碼。
可能,有可能。
創(chuàng)新公司有想法和團隊,但他們?nèi)鄙贆C房和電纜。前者是他們賴以生存的氧氣,后者是他們賴以生存的水,缺了哪項都不行。
自建云
Facebook的馬克·扎克伯格是一位有遠見的技術(shù)狂人。在 Facebook 創(chuàng)建初期堅持儲備大于當前用戶數(shù)量10倍的計算與存儲作為業(yè)務(wù)的保障。在當他們還負擔(dān)不起自有機房的時期里,這項策略幫助 Facebook 邁過了一次次的用戶涌入而不至于崩盤。現(xiàn)在 Facebook 將建造數(shù)據(jù)中心作為業(yè)務(wù)發(fā)展的重要任務(wù)予以對待,從機房設(shè)計到硬件配置始終親力親為。(近日,F(xiàn)acebook 將披露新建的一家數(shù)據(jù)中心的技術(shù)規(guī)格,其中包括計算機、電源、服務(wù)器機柜、電池備份系統(tǒng)和建筑設(shè)計的細節(jié)。Open Compute Project)
自建云,讓大企業(yè)的發(fā)展不受制約,并給予其制約其他企業(yè)的機會。
云震,終將過去。多難興邦,“多震興業(yè)”,希望如此吧。(原文鏈接:ifanr.com/38849)