突破極限！全新后訓練模型震撼發布，性能全面超越Llama 3.1 Instruct！

長達 73 的技術報告詳細介紹了后訓練的細節。

原標題：這才是真?開源模型！公開「后訓練」一切，性能超越Llama 3.1 Instruct
文章來源：機器之心
內容字數：7615字

根據機器之心的報道，艾倫人工智能研究所（Ai2）推出了開源模型Tülu 3，成為開源模型陣營中的新亮點。該模型目前有8B和70B兩個版本，并計劃在未來推出405B版本。最新數據顯示，Tülu 3的性能超過了Llama 3.1 Instruct的對應版本。

Tülu 3的技術報告長達73頁，詳細介紹了其后訓練（post-training）方法。后訓練被認為是提升模型性能的關鍵，尤其是在數學、代碼和長程規劃等領域。Ai2通過引入新的數據集和訓練流程，試圖縮小開源模型和封閉模型之間的性能差距。

Tülu 3的后訓練過程分為四個階段：

Ai2為Tülu 3設計了一套評估框架，展示了該模型在多個基準測試中的優異表現。尤其是在指令遵從、知識調用和數學推理等方面，Tülu 3的表現與Claude 3.5 Haiku相當，甚至在部分場景中表現更佳。

在安全性評估中，Tülu 3相較于其他開源模型也展現出優勢。Ai2不僅發布了模型，還公開了所有數據集、訓練配方和代碼，推動開源模型社區的發展。未來，Ai2可能會基于Qwen進行Tülu模型的進一步訓練，期待更多研究者能夠在后訓練領域進行創新。

綜上所述，Tülu 3的推出標志著開源模型在性能和透明度方面的顯著進步，將為研究者提供更多的實驗基礎和靈感。

文章來源：機器之心
作者微信：
作者簡介：專業的人工智能媒體和產業服務平臺

文章版權歸作者所有，未經允許請勿轉載。

暫無評論...