愛伊米

一度宕機6小時 微軟Azure虛擬機器做出迴應

據外媒報道,微軟的Azure虛擬機器服務於2021年10月13日05:12 UTC至11:45UTC期間遭遇了長達6個小時的中端,其中使用Windows虛擬機器的Azure客戶子集在執行服務管理操作時面臨著各種問題,包括啟動、建立、更新、刪除虛擬機器的眾多操作均告失敗,對Windows虛擬機器有依賴性的服務也可能遇到類似的故障。

一度宕機6小時 微軟Azure虛擬機器做出迴應

針對此事,微軟也公佈了初步調查結果:

我們發現在服務管理操作過程中呼叫失敗,因為無法查詢到所需的工件版本資料。我們的調查集中在後端計算資源提供者(CRP),以確定呼叫失敗的原因,並確定無法從儲存庫中查詢到所需的VMGuestAgent。VM Guest Agent Extension釋出架構正在被遷移(作為傳統服務管理後臺系統遷移的一部分)到一個新的平臺,該平臺利用了最新的 Azure Resource Manager(ARM)功能。

緩解措施:我們透過將適當的擴充套件標記為正確的預期級別(在這種情況下是公開的)來減輕影響。工程師們主動驗證了更新完成後,操作恢復到完全成功率。

接下來的步驟。我們將繼續調查,以確定完整的根本原因,並防止未來發生。完整的根本原因分析(RCA)將在 72 小時內公佈。”