微軟小模型擊敗大模型:27億參數(shù),手機(jī)就能跑
AIGC動態(tài)歡迎閱讀
原標(biāo)題:微軟小模型擊敗大模型:27億參數(shù),手機(jī)就能跑
關(guān)鍵字:模型,微軟,數(shù)據(jù),語言,性能
文章來源:機(jī)器之心
內(nèi)容字?jǐn)?shù):4848字
內(nèi)容摘要:機(jī)器之心報道編輯:杜偉、小舟在「小搏大」這條技術(shù)發(fā)展路線上,微軟一直在前進(jìn)。上個月,微軟 CEO 納德拉在 Ignite 大會上宣布自研小尺寸模型 Phi-2 將完全開源,在常識推理、語言理解和邏輯推理方面的性能顯著改進(jìn)。今天,微軟公布了 Phi-2 模型的更多細(xì)節(jié)以及全新的提示技術(shù) promptbase。這個僅 27 億參數(shù)的模型在大多數(shù)常識推理、語言理解、數(shù)學(xué)和編碼任務(wù)上超越了 Llama2 7B、Llama2 13B、Mistral 7B,與 Llama2 70B 的差距也在縮小(甚至更好)。同時,小尺寸的 Phi-2 可以在筆記本電腦、手機(jī)等移動設(shè)備上運(yùn)行。納德拉表示,微軟非常高興將一流的小語言模型(SLM)和 SOTA 提示技術(shù)向研發(fā)人員分享。今年 6 月,微軟在一篇題為《Textbooks Are All You Need》的論文中,用規(guī)模僅為 7B token 的「教科書質(zhì)量…
原文鏈接:點此閱讀原文:微軟小模型擊敗大模型:27億參數(shù),手機(jī)就能跑
聯(lián)系作者
文章來源:機(jī)器之心
作者微信:almosthuman2014
作者簡介:專業(yè)的人工智能媒體和產(chǎn)業(yè)服務(wù)平臺
? 版權(quán)聲明
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載。
相關(guān)文章
暫無評論...