AIGC動態歡迎閱讀
原標題:手機秒變超腦!微軟Phi-3已經超越主流大模型!
關鍵字:模型,語言,數據,知識,人工智能
文章來源:AI范兒
內容字數:5245字
內容摘要:
點擊上方藍字關注我們“微軟phi-3系列語言模型,尤其phi-3-mini,憑借創新數據集(精選網絡數據與合成數據)和高效訓練,實現小模型媲美Mixtral 8x7B、GPT-3.5的性能。該系列在MMLU、MT-bench等評測中展現卓越語言理解與對話能力,且phi-3-mini可通過集成搜索功能彌補知識局限。人工智能領域的語言模型競賽如火如荼,各路選手紛紛刷新記錄,追求更大、更強。大型語言模型 (LLMs) 的規模從五年前的僅 10 億個參數(GPT-2 有 15 億個參數)猛增到今天的萬億個參數。這項工作的動力源于通過訓練大型模型獲得的看似可預測的改進,即所謂的縮放定律。
但是,這些定律假定數據源是“固定的”。這種假設現在被前沿LLMs本身的存在大大打亂了,它使我們能夠以新穎的方式與數據進行交互。
近日,微軟推出的phi-3系列,尤其是phi-3-mini,猶如一匹低調卻實力超群的黑馬,將頂尖的語言理解能力濃縮進一部普通的智能手機。
phi-3-mini,是一個在 3.3 萬億個Token上訓練的 38 億參數語言模型,通過學術基準測試和內部測試衡量,其整體性能可與 Mixtra
聯系作者
文章來源:AI范兒
作者微信:AI_Insights
作者簡介:AI領域四大媒體之一。 智能未來,始于Prompt!
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...