數(shù)學(xué)奇跡:微軟Phi-4小模型如何以14B參數(shù)超越GPT-4o!
原標(biāo)題:微軟Phi-4封神,14B小模型數(shù)學(xué)擊敗GPT-4o!合成數(shù)據(jù)占比40%,36頁技術(shù)報(bào)告出爐
文章來源:新智元
內(nèi)容字?jǐn)?shù):9233字
微軟推出新一代小模型Phi-4
微軟最近正式發(fā)布了其下一代小模型Phi-4,具有140億個(gè)參數(shù),創(chuàng)新性地使用40%的合成數(shù)據(jù)進(jìn)行訓(xùn)練。該模型在數(shù)學(xué)推理和STEM領(lǐng)域的性能上顯著超越了GPT-4o和Gemini Pro 1.5,為人工智能模型的發(fā)展帶來了新的突破。
1. Phi-4的核心技術(shù)
Phi-4的成功主要得益于三大核心技術(shù):使用合成數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練和中訓(xùn)練、高質(zhì)量有機(jī)數(shù)據(jù)的篩選與過濾,以及先進(jìn)的后訓(xùn)練方法。合成數(shù)據(jù)的高比例和高質(zhì)量使得Phi-4在推理任務(wù)上表現(xiàn)出色,甚至與更大模型的表現(xiàn)相當(dāng)。
2. 優(yōu)越的數(shù)學(xué)性能
在2024 ACM數(shù)學(xué)競賽中,Phi-4取得了91.8%的準(zhǔn)確率,顯示出其在數(shù)學(xué)推理方面的卓越能力。研究表明,Phi-4在許多基準(zhǔn)測試中,其表現(xiàn)超越了其教師模型GPT-4o,并在STEM問答任務(wù)中展現(xiàn)出強(qiáng)大的實(shí)力。
3. 合成數(shù)據(jù)的優(yōu)勢
合成數(shù)據(jù)為Phi-4訓(xùn)練的主要組成部分,通過多種技術(shù)生成,避免了傳統(tǒng)數(shù)據(jù)集中的一些弱點(diǎn)。相比于有機(jī)數(shù)據(jù),合成數(shù)據(jù)在結(jié)構(gòu)化和支持漸進(jìn)式學(xué)習(xí)方面具有優(yōu)勢,使得模型學(xué)習(xí)效率更高。
4. 后訓(xùn)練技術(shù)的創(chuàng)新
后訓(xùn)練階段的關(guān)鍵技術(shù)——關(guān)鍵token搜索(PTS),能夠識別出影響模型正確性的關(guān)鍵token,從而優(yōu)化模型的輸出。結(jié)合拒絕采樣和直接偏好優(yōu)化(DPO),Phi-4在減少幻覺現(xiàn)象上也取得了顯著進(jìn)展。
5. 展望未來
盡管Phi-4在多個(gè)基準(zhǔn)測試中表現(xiàn)優(yōu)秀,但研究團(tuán)隊(duì)仍發(fā)現(xiàn)該模型在遵循指令方面存在不足。未來,團(tuán)隊(duì)計(jì)劃通過有針對性的合成數(shù)據(jù)進(jìn)一步提升Phi系列模型的指令跟隨性能,期待后續(xù)發(fā)布的模型帶來更多驚喜。
聯(lián)系作者
文章來源:新智元
作者微信:
作者簡介:智能+中國主平臺,致力于推動中國從互聯(lián)網(wǎng)+邁向智能+新紀(jì)元。重點(diǎn)關(guān)注人工智能、機(jī)器人等前沿領(lǐng)域發(fā)展,關(guān)注人機(jī)融合、人工智能和機(jī)器人對人類社會與文明進(jìn)化的影響,領(lǐng)航中國新智能時(shí)代。