iPhone可跑2B小鋼炮!谷歌Gemma 2來襲,最強(qiáng)顯微鏡剖解LLM大腦
AIGC動態(tài)歡迎閱讀
原標(biāo)題:iPhone可跑2B小鋼炮!谷歌Gemma 2來襲,最強(qiáng)顯微鏡剖解LLM大腦
關(guān)鍵字:解讀,模型,報(bào)告,編碼器,特征
文章來源:新智元
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
新智元報(bào)道編輯:編輯部
【新智元導(dǎo)讀】谷歌DeepMind的小模型來了,Gemma 2 2B直接擊敗了參數(shù)大幾個(gè)數(shù)量級的GPT-3.5和Mixtral 8x7B!而同時(shí)發(fā)布的Gemma Scope,如顯微鏡一般打破LLM黑箱,讓我們看清Gemma 2是如何決策的。谷歌DeepMind的小模型,又上新了!
就在剛剛,谷歌DeepMind發(fā)布Gemma 2 2B。它是從Gemma 2 27B中蒸餾而來。
雖然它的參數(shù)只有2.6B,但在LMSYS競技場上的得分,已經(jīng)超越了GPT-3.5和Mixtral 8x7B!
在MMLU和MBPP基準(zhǔn)測試中,它分別取得了56.1和36.6的優(yōu)異成績;比起前代模型Gemma 1 2B,它的性能超過了10%。
小模型擊敗了大幾個(gè)數(shù)量級的大模型,再一次印證了最近業(yè)界非常看好的小模型方向。
谷歌在今天,一共公布了Gemma 2家族的三個(gè)新成員:
Gemma 2 2B:輕量級2B模型,在性能和效率之間實(shí)現(xiàn)了最大的平衡
ShieldGemma:基于Gemma 2構(gòu)建的安全內(nèi)容分類器模型,用于過濾AI模型的輸入和輸出,確保用戶安全
Gemma Scope:一種可
原文鏈接:iPhone可跑2B小鋼炮!谷歌Gemma 2來襲,最強(qiáng)顯微鏡剖解LLM大腦
聯(lián)系作者
文章來源:新智元
作者微信:
作者簡介: