手機秒變超腦！微軟Phi-3已經(jīng)超越主流大模型！

AIGC動態(tài)2年前 (2024)發(fā)布 AI范兒

AIGC動態(tài)歡迎閱讀

原標題：手機秒變超腦！微軟Phi-3已經(jīng)超越主流大模型！
關(guān)鍵字：模型,語言,數(shù)據(jù),知識,人工智能
文章來源：AI范兒
內(nèi)容字數(shù)：5245字

內(nèi)容摘要：

點擊上方藍字關(guān)注我們“微軟phi-3系列語言模型，尤其phi-3-mini，憑借創(chuàng)新數(shù)據(jù)集（精選網(wǎng)絡(luò)數(shù)據(jù)與合成數(shù)據(jù)）和高效訓(xùn)練，實現(xiàn)小模型媲美Mixtral 8x7B、GPT-3.5的性能。該系列在MMLU、MT-bench等評測中展現(xiàn)卓越語言理解與對話能力，且phi-3-mini可通過集成搜索功能彌補知識局限。人工智能領(lǐng)域的語言模型競賽如火如荼，各路選手紛紛刷新記錄，追求更大、更強。大型語言模型（LLMs）的規(guī)模從五年前的僅 10 億個參數(shù)（GPT-2 有 15 億個參數(shù)）猛增到今天的萬億個參數(shù)。這項工作的動力源于通過訓(xùn)練大型模型獲得的看似可預(yù)測的改進，即所謂的縮放定律。
但是，這些定律假定數(shù)據(jù)源是“固定的”。這種假設(shè)現(xiàn)在被前沿LLMs本身的存在大大打亂了，它使我們能夠以新穎的方式與數(shù)據(jù)進行交互。
近日，微軟推出的phi-3系列，尤其是phi-3-mini，猶如一匹低調(diào)卻實力超群的黑馬，將頂尖的語言理解能力濃縮進一部普通的智能手機。
phi-3-mini，是一個在 3.3 萬億個Token上訓(xùn)練的 38 億參數(shù)語言模型，通過學(xué)術(shù)基準測試和內(nèi)部測試衡量，其整體性能可與 Mixtra

原文鏈接：手機秒變超腦！微軟Phi-3已經(jīng)超越主流大模型！