數學奇跡：微軟Phi-4小模型如何以14B參數超越GPT-4o！

原標題：微軟Phi-4封神，14B小模型數學擊敗GPT-4o！合成數據占比40%，36頁技術報告出爐
文章來源：新智元
內容字數：9233字

微軟最近正式發布了其下一代小模型Phi-4，具有140億個參數，創新性地使用40%的合成數據進行訓練。該模型在數學推理和STEM領域的性能上顯著超越了GPT-4o和Gemini Pro 1.5，為人工智能模型的發展帶來了新的突破。

Phi-4的成功主要得益于三大核心技術：使用合成數據進行預訓練和中訓練、高質量有機數據的篩選與過濾，以及先進的后訓練方法。合成數據的高比例和高質量使得Phi-4在推理任務上表現出色，甚至與更大模型的表現相當。

在2024 ACM數學競賽中，Phi-4取得了91.8%的準確率，顯示出其在數學推理方面的卓越能力。研究表明，Phi-4在許多基準測試中，其表現超越了其教師模型GPT-4o，并在STEM問答任務中展現出強大的實力。

合成數據為Phi-4訓練的主要組成部分，通過多種技術生成，避免了傳統數據集中的一些弱點。相比于有機數據，合成數據在結構化和支持漸進式學習方面具有優勢，使得模型學習效率更高。

后訓練階段的關鍵技術——關鍵token搜索（PTS），能夠識別出影響模型正確性的關鍵token，從而優化模型的輸出。結合拒絕采樣和直接偏好優化（DPO），Phi-4在減少幻覺現象上也取得了顯著進展。

盡管Phi-4在多個基準測試中表現優秀，但研究團隊仍發現該模型在遵循指令方面存在不足。未來，團隊計劃通過有針對性的合成數據進一步提升Phi系列模型的指令跟隨性能，期待后續發布的模型帶來更多驚喜。

聯系作者

文章來源：新智元
作者微信：
作者簡介：智能+中國主平臺，致力于推動中國從互聯網+邁向智能+新紀元。重點關注人工智能、機器人等前沿領域發展，關注人機融合、人工智能和機器人對人類社會與文明進化的影響，領航中國新智能時代。

文章版權歸作者所有，未經允許請勿轉載。

暫無評論...