<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        gpt-oss

        AI工具12小時前更新 AI工具集
        2 0 0

        gpt-oss – OpenAI開源的推理模型系列

        GPT-OSS 是 OpenAI 推出的開源推理模型系列,包含 gpt-oss-120b 和 gpt-oss-20b 兩個版本。這兩個模型均基于 MoE 架構,支持 128k 上下文長度,性能接近閉源模型,在工具調用、少樣本函數調用、鏈式思考推理及健康問答等方面表現出色。gpt-oss-120b 擁有 1170 億參數,激活參數約 51 億,能在單張 80GB GPU 上運行;gpt-oss-20b 擁有 210 億參數,激活參數約 36 億,能在 16GB 內存的消費級設備上運行。模型基于 Apache 2.0 許可證開源,支持免費商用,為開發者提供強大的本地推理能力。

        認識 GPT-OSS

        GPT-OSS,全稱為 OpenAI 推出的開源推理模型系列,為開發者提供了強大的本地推理解決方案。它包含兩個版本:gpt-oss-120b 和 gpt-oss-20b。這兩個模型的核心在于其 MoE(混合專家)架構設計,賦予它們出色的性能表現。GPT-OSS 能夠勝任多種任務,包括工具調用、少樣本函數調用、鏈式思考推理以及健康問答等,性能可與閉源模型媲美。值得一提的是,GPT-OSS 基于 Apache 2.0 許可證開源,允許免費商用,為開發者提供了極大的靈活性。

        GPT-OSS 的核心功能

        • 工具賦能:GPT-OSS 能夠調用外部工具,如網頁搜索、Python 代碼解釋器,從而解決復雜問題,增強問題解決能力。
        • 鏈式思維:它具備鏈式思考能力,能夠將復雜問題分解為多個步驟,逐步解決,尤其適合多步驟推理任務。
        • 靈活部署:gpt-oss-20b 能夠在 16GB 內存的設備上運行,滿足消費級設備的需求;gpt-oss-120b 則可在 80GB GPU 上運行,滿足高性能需求。
        • 快速響應:推理速度可達 40-50 tokens/s,確保在需要快速響應的場景中表現出色。
        • 開放:提供完整的模型權重和代碼,支持本地微調和定制,滿足特定任務需求。
        • 推理強度可調:支持低、中、高三種推理強度,用戶可以根據實際需求進行調整,實現延遲與性能之間的平衡。

        GPT-OSS 的技術揭秘

        • 模型架構:基于 Transformer 架構,GPT-OSS 采用了混合專家(MoE)技術,減少了處理輸入所需的活躍參數數量,從而提升了推理效率。它還采用了交替的密集和局部帶狀稀疏注意力模式,類似于 GPT-3,進一步優化了內存和計算效率。此外,分組多查詢注意力機制(分組大小為 8)和 RoPE 位置編碼(支持最長 128k 的上下文長度)也被應用于其中,以提升推理效率和上下文處理能力。
        • 訓練歷程:GPT-OSS 經過了精心設計和訓練。預訓練階段,它使用了高質量的純文本數據集,重點關注 STEM、編程和通用知識領域。后訓練階段則采用了與 o4-mini 類似的流程,包括監督式微調和高計算量的強化學習階段。訓練目標是讓模型符合 OpenAI 模型規范,具備鏈式推理和工具調用能力。
        • 量化與優化:GPT-OSS 采用了 MXFP4 格式進行量化,模型在訓練階段就適應了低精度環境,確保在減少模型體積的同時保持高性能。gpt-oss-20b 量化后模型大小約為 12.8GB,可在 16GB 內存設備上運行。gpt-oss-120b 量化后可在 80GB 內存中運行。此外,GPT-OSS 還與 NVIDIA、AMD 等硬件廠商合作,確保模型在各類系統上實現性能優化。
        • 安全機制:GPT-OSS 在安全方面也下足了功夫。在預訓練階段,它會過濾與化學、生物、放射性和核(CBRN)相關的有害數據。通過審慎對齊和指令優先級評估,訓練模型拒絕不安全提示并抵御注入攻擊。此外,GPT-OSS 還會在特定領域(如生物學和網絡安全)進行對抗性微調,評估并優化模型的安全性。

        GPT-OSS 的性能表現

        • 基準測試表現
          • 編程競賽:在 Codeforces 競賽編程測試中,gpt-oss-120b 取得了 2622 分,gpt-oss-20b 取得了 2516 分,表現優于部分開源模型,略遜于閉源的 o3 和 o4-mini。
          • 通用問題解決:在 MMLU 和 HLE 測試中,gpt-oss-120b 表現優于 OpenAI 的 o3-mini,并接近 o4-mini 的水平。
          • 工具調用能力:在 TauBench 智能體評估套件中,gpt-oss-120b 和 gpt-oss-20b 的表現均優于 OpenAI 的 o3-mini,達到或超過了 o4-mini 的水平。
          • 健康問答:在 HealthBench 測試中,gpt-oss-120b 的表現超越了 o4-mini,而 gpt-oss-20b 則達到了與 o3-mini 相當的水平。

        產品信息

        GPT-OSS 的應用場景

        • 本地推理與數據安全:在涉及隱私的領域(如醫療、金融),GPT-OSS 可以在本地設備上運行,確保數據安全,同時提供強大的推理能力。
        • 代碼輔助與開發提效:開發者可以利用 GPT-OSS 調用工具生成和驗證代碼片段,顯著提升編程效率,減少調試時間。
        • 智能客服與客戶服務:企業可以部署 GPT-OSS 作為智能客服,快速響應客戶咨詢,提供準確答案,降低人力成本。
        • 教育輔助與學習支持:學生可以借助 GPT-OSS 輔助學習,解答問題、提供寫作建議,提升學習效率和理解能力。
        • 創意內容生成:作家、編劇、游戲開發者等可以利用 GPT-OSS 生成創意內容,激發靈感,提升創作效率。

        常見問題

        Q: GPT-OSS 與其他開源模型相比有什么優勢?

        A: GPT-OSS 提供了強大的性能,尤其在工具調用、鏈式思考推理等任務上表現出色,同時支持本地部署,確保數據安全與隱私。它的低資源需求也使其能夠在各種設備上運行。

        Q: 如何開始使用 GPT-OSS?

        A: 您可以訪問 GitHub 倉庫和 HuggingFace 模型庫,獲取模型權重和代碼,進行本地部署和微調。您也可以通過在線體驗 Demo 快速上手。

        Q: GPT-OSS 的模型大小和硬件要求是什么?

        A: GPT-OSS 包含兩個版本:gpt-oss-20b(210 億參數,可在 16GB 內存設備上運行)和 gpt-oss-120b(1170 億參數,需要在 80GB GPU 上運行)。

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 亚洲va精品中文字幕| 在线jlzzjlzz免费播放| 亚洲国产精品尤物yw在线| 亚洲乱亚洲乱妇24p| 国产大片线上免费观看 | XXX2高清在线观看免费视频| 日本特黄特色免费大片| 亚洲JIZZJIZZ妇女| 国产小视频免费观看| 久久精品熟女亚洲av麻豆| 免费一级特黄特色大片在线观看| 无遮挡呻吟娇喘视频免费播放| 亚洲成av人片天堂网老年人| www成人免费视频| 亚洲AV无码专区国产乱码电影| 日本三级在线观看免费| 久久亚洲精品中文字幕| 成年人视频免费在线观看| 国产亚洲精品成人AA片| 国产成人aaa在线视频免费观看| 一级毛片免费播放男男| 国产∨亚洲V天堂无码久久久| 在线成人爽a毛片免费软件| 日韩亚洲产在线观看| 亚洲高清免费视频| 成全动漫视频在线观看免费高清版下载| 国产l精品国产亚洲区在线观看| 99re6热视频精品免费观看| 亚洲一区动漫卡通在线播放| 国产精品久久久久影院免费| 国产vA免费精品高清在线观看| 国产l精品国产亚洲区在线观看| 青青在线久青草免费观看| 黄页网站在线免费观看| 亚洲国产精品无码一线岛国| 曰曰鲁夜夜免费播放视频| 免费看美女午夜大片| 久久综合亚洲鲁鲁五月天| 免费黄网在线观看| 最新国产乱人伦偷精品免费网站| 亚洲18在线天美|