iPhone可跑2B小鋼炮！谷歌Gemma 2來襲，最強(qiáng)顯微鏡剖解LLM大腦

AIGC動態(tài)1年前 (2024)發(fā)布新智元

AIGC動態(tài)歡迎閱讀

原標(biāo)題：iPhone可跑2B小鋼炮！谷歌Gemma 2來襲，最強(qiáng)顯微鏡剖解LLM大腦
關(guān)鍵字：解讀,模型,報(bào)告,編碼器,特征
文章來源：新智元
內(nèi)容字?jǐn)?shù)：0字

內(nèi)容摘要：

新智元報(bào)道編輯：編輯部
【新智元導(dǎo)讀】谷歌DeepMind的小模型來了，Gemma 2 2B直接擊敗了參數(shù)大幾個(gè)數(shù)量級的GPT-3.5和Mixtral 8x7B！而同時(shí)發(fā)布的Gemma Scope，如顯微鏡一般打破LLM黑箱，讓我們看清Gemma 2是如何決策的。谷歌DeepMind的小模型，又上新了！
就在剛剛，谷歌DeepMind發(fā)布Gemma 2 2B。它是從Gemma 2 27B中蒸餾而來。
雖然它的參數(shù)只有2.6B，但在LMSYS競技場上的得分，已經(jīng)超越了GPT-3.5和Mixtral 8x7B！
在MMLU和MBPP基準(zhǔn)測試中，它分別取得了56.1和36.6的優(yōu)異成績；比起前代模型Gemma 1 2B，它的性能超過了10%。
小模型擊敗了大幾個(gè)數(shù)量級的大模型，再一次印證了最近業(yè)界非常看好的小模型方向。
谷歌在今天，一共公布了Gemma 2家族的三個(gè)新成員：
Gemma 2 2B：輕量級2B模型，在性能和效率之間實(shí)現(xiàn)了最大的平衡
ShieldGemma：基于Gemma 2構(gòu)建的安全內(nèi)容分類器模型，用于過濾AI模型的輸入和輸出，確保用戶安全
Gemma Scope：一種可

原文鏈接：iPhone可跑2B小鋼炮！谷歌Gemma 2來襲，最強(qiáng)顯微鏡剖解LLM大腦