如何在雲伺服器故障時維持服務?
二○二二年十二月,阿里雲香港發生了一次服務中斷故障,阿里雲在香港沒有自建機房,通過租用電訊盈科伺服器機房來實現服務,因此,當電訊盈科機房的中央空調系統故障時,由於未能快速修復,造成了十二小時的服務停頓。受事件影響,一些政府部門、娛樂場所、大型酒店、外賣平台、電子報紙等應用程式均無法正常運作。
澳門部分有購買阿里雲香港服務的中小企業,在故障發生時,他們的服務同樣受到影響。儘管在故障發生後的數小時,阿里雲為企業提供了備用伺服器,讓他們把服務恢復過來,可是,由於提供的備用伺服器資源不足,且受影響的中小企中,大多缺乏人手和技術能力,因此,在阿里雲修復前,他們的服務都未能重啟。
上述事件正好帶出我們今天的主題,如何在雲伺服器中斷的時候,讓你的服務仍可以正常運作?曾有專家分析指出,尋找能提供優質服務的供應商便可避免問題的發生,但這次事故正好反映出,即便再好的供應商亦無法完全避免故障的發生。正所謂救人者必先自救,筆者在此向各位讀者分享如何在雲伺服器故障時仍能維持服務。
方案一 : 負載均衡
負載均衡的原理是利用兩個小型伺服器組成一個大型伺服器,分別設置在兩個不同的公司和位置上。雖然這種方式的成本會比直接購買一個大型伺服器高,但是它可以保證在單一故障時不會造成全面的服務中斷。另外,這種方式還有一個好處,就是可以根據不同的區域進行購買,例如,在公司多個服務區域如內地和澳門,可以購買兩個地區的雲服務進行組合,這樣可以實現更快的網速連接。當然,這種方式需要較高的技術成本,需要研究如何組成伺服器,以及如何實現伺服器之間的加密溝通。
方案二 : 線上線下伺服器
在線上提供雲服務的同時,可以通過線下伺服器同步雲伺服器中的資料。當線上雲伺服器中斷時,可以通過更換DNS來實現線下伺服器直接對外提供服務。這種方式的好處是,線下伺服器中永遠都會有一份最新的資料,同時也可以擁有自己的備用伺服器。然而,這種方式的壞處是需要額外購買伺服器並進行日常的維護。
總括來說,企業可按自身的需求、公司規模和預算等因素來選擇合適的方案。就以上兩個方案,筆者認為方案一是相對較好的選擇,因為它讓您可以按照不同的地區購買不同的雲服務來構建伺服器,這是現代大型網站的標準做法。雖然這種方法的成本比較高,但它卻可以提供最好的服務。方案二的好處是可以完整備份並且可以自行管理,用家甚至可以使用閒置的舊電腦作為伺服器,而且儲存空間成本也相對比較便宜,對於澳門的小微企業來說更為適合。此外,對於使用免費軟件進行差異式日期備份的用家,筆者建議定期對軟件進行監察,確保軟件正常運作。
何榮倫