微軟發布Phi-3，性能超Llama-3，可手機端運行

AIGC動態2年前 (2024)發布機器之心

AIGC動態歡迎閱讀

原標題：微軟發布Phi-3，性能超Llama-3，可手機端運行
關鍵字：模型,報告,微軟,數據,基準
文章來源：機器之心
內容字數：3522字

內容摘要：

機器之心報道
編輯：小舟、澤南數據已成為提升大模型能力的重點。Llama-3 剛發布沒多久，競爭對手就來了，而且是可以在手機上運行的小體量模型。
本周二，微軟發布了自研小尺寸模型 Phi-3。
新模型有三個版本，其中 Phi-3 mini 是一個擁有 38 億參數的語言模型，經過 3.3 萬億 token 的訓練，其整體性能在學術基準和內部測試上成績優異。
盡管 Phi-3 mini 被優化至可部署在手機上，但它的性能可以與 Mixtral 8x7B 和 GPT-3.5 等模型相媲美。微軟表示，創新主要在于用于訓練的數據集。與此同時，Phi-3 與 Llama-2 使用相同的架構，方便開源社區在其基礎上開發。此前，微軟的 Phi 系列模型曾經引發了人們的熱議，去年 6 月，微軟發布了《Textbooks Are All You Need》論文，用規模僅為 7B token 的「教科書質量」數據訓練 1.3B 參數的模型 phi-1，實現了良好的性能。
去年 9 月，微軟進一步探索這條道路，讓 1.3B 參數的 Transformer 架構語言模型 Phi-1.5 顯示出強大的編碼能力。

原文鏈接：微軟發布Phi-3，性能超Llama-3，可手機端運行