<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        OpenAI 史上最長宕機:自研 K8s 成“攔路虎”,導致數小時無法修復

        AIGC動態7個月前發布 AI前線
        359 0 0

        OpenAI提到,在客戶感受到影響的“幾分鐘”內,公司就檢測到了該問題;但由于必須繞過不堪重負的Kubernetes服務器,因此無法快速實施修復。

        OpenAI 史上最長宕機:自研 K8s 成“攔路虎”,導致數小時無法修復

        原標題:OpenAI 史上最長宕機:自研 K8s 成“攔路虎”,導致數小時無法修復
        文章來源:AI前線
        內容字數:11311字

        OpenAI大規模服務中斷深度解析

        本文總結了OpenAI于2024年12月11日發生的全球中斷,詳細分析其原因、影響、補救措施及未來預防方案。

        1. 概述及影響

        2024年12月11日下午3點左右,OpenAI旗下ChatGPT、Sora以及API服務均出現嚴重中斷,持續約三個小時。此次波及全球用戶,對ChatGPT、API和Sora等所有服務造成嚴重影響,嚴重程度在下午3點40分達到峰值。OpenAI在事后發布了詳細的故障報告,承認此次宕機并非安全或新產品發布引起。

        2. 根本原因分析

        根本原因在于新部署的用于收集Kubernetes指標的監控服務配置錯誤。該服務覆蓋范圍極廣,導致數千個節點同時執行資源密集型Kubernetes API操作,最終壓垮了Kubernetes API服務器,使大部分集群的控制平面癱瘓。DNS依賴于控制平面,服務之間無法通信,進一步加劇了故障影響。雖然在登臺環境中測試未發現問題,但大規模集群及DNS緩存延緩了故障的發現。

        3. 測試與部署問題

        OpenAI在登臺集群中測試了新服務,但未發現問題。大規模集群才暴露了問題,DNS緩存也掩蓋了問題,導致部署繼續進行。部署前,OpenAI關注資源消耗,但未評估Kubernetes API服務器負載,監控流程也未充分配備集群運行狀況監控協議。DNS緩存延緩了問題發現時間,加劇了故障影響。

        4. 補救措施及時間線

        OpenAI在幾分鐘內確定問題,并采取了縮小集群規模、阻止對Kubernetes管理員API的網絡訪問以及擴展Kubernetes API服務器等措施。在恢復部分控制平面訪問權限后,恢復工作迅速進行,但由于資源限制和部分集群性能降級,仍需額外手動干預。整個恢復過程歷時約四個小時。

        5. 未來預防措施

        為避免類似再次發生,OpenAI將采取以下措施:改進登臺發布機制,增強基礎設施變化監控;進行故障注入測試,確保系統能檢測并回滾問題;實施應急機制,保證工程師在任何情況下都能訪問Kubernetes API服務器;解耦Kubernetes數據平面和控制平面;加快恢復速度,改進緩存和動態速率限制器。

        6. OpenAI內部技術架構

        OpenAI擁有復雜的計算環境,使用了自研框架Rapid和Rcall以及開源框架如Ray、Kubeflow等。Rapid抽象了平臺API,將虛擬機視為工作單元,提高了實驗隔離性;Rcall則支持Kubernetes和云服務后端,方便研究人員測試和調試任務。OpenAI還使用Prometheus和Grafana進行監控和告警。

        7. 總結

        OpenAI此次大規模服務中斷暴露了其基礎設施管理中的不足,也促使其反思并改進相關流程和技術。OpenAI承諾將改進其可靠性,避免類似再次發生,并為用戶帶來的不便表示歉意。


        聯系作者

        文章來源:AI前線
        作者微信:
        作者簡介:面向AI愛好者、開發者和科學家,提供大模型最新資訊、AI技術分享干貨、一線業界實踐案例,助你全面擁抱AIGC。

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 狠狠亚洲狠狠欧洲2019| 人与禽交免费网站视频| 亚洲一区动漫卡通在线播放| 久久亚洲精品无码VA大香大香| 亚洲卡一卡二卡乱码新区| 久久国产色AV免费看| 亚洲av一综合av一区| 亚洲免费观看视频| 91福利视频免费| 老色鬼久久亚洲AV综合| 99亚洲男女激情在线观看| 人成午夜免费大片在线观看| 亚洲第一黄色网址| 久久久WWW成人免费精品| 九九精品免费视频| 国产成人精品久久亚洲高清不卡 | 免费夜色污私人影院网站电影| 免费国产综合视频在线看| 日韩毛片在线免费观看| 久久久久亚洲?V成人无码| a毛片免费播放全部完整| 99人中文字幕亚洲区 | 在线观看免费播放av片| 久久国产亚洲电影天堂| 免费播放美女一级毛片| 成人免费视频69| jiz zz在亚洲| 亚洲乱码国产一区网址| 日本免费中文字幕| 亚洲VA综合VA国产产VA中| 中文字幕免费在线看线人动作大片| 热99re久久精品精品免费| 久久夜色精品国产噜噜噜亚洲AV | 永久黄网站色视频免费直播| 美女扒开尿口给男人爽免费视频| 国产亚洲精品无码拍拍拍色欲| 热久久这里是精品6免费观看| 亚洲日本视频在线观看| 亚洲?V无码乱码国产精品| 亚洲伊人久久大香线蕉AV| 国产免费丝袜调教视频|