AIGC動態歡迎閱讀
原標題:谷歌狂卷小模型,20億參數Gemma 2趕超GPT-3.5,實測iPhone上跑得飛快
關鍵字:報告,模型,解讀,內容,參數
文章來源:智東西
內容字數:0字
內容摘要:
每秒40 Token,谷歌開源20億參數“小鋼炮”。
編譯 |香草
編輯|李水青
谷歌DeepMind的開源小模型家族,又迎來新成員!
智東西8月1日消息,今日凌晨,谷歌DeepMind開源了輕量級模型Gemma 2 2B,其在大模型競技場上的分數超越了GPT-3.5、Llama 2 70B等更大參數的模型。
▲Gemma 2 2B
只有20億參數使得Gemma 2 2B可以輕松在手機、PC等終端設備上快速運行。開發者實測在Google AI Studio上,其推理速度達到30~40 tokens/s。
▲開發者測試Gemma 2 2B
與Gemma 2 2B一起推出的,還有用于增強模型可解釋性的工具Gemma Scope,以及用于過濾有害內容的安全分類模型ShieldGemma。
Gemma Scope基于稀疏自動編碼器(SAE)放大模型中的特定點,并采用JumpReLU架構對其進行優化,從而幫助解析模型中處理的密集復雜信息,像一個顯微鏡一樣讓研究人員能“看到”模型內部。
ShieldGemma則針對仇恨、騷擾、內容、危險內容四個危害領域構建,在響應測試中超過GPT-4等基準
原文鏈接:谷歌狂卷小模型,20億參數Gemma 2趕超GPT-3.5,實測iPhone上跑得飛快
聯系作者
文章來源:智東西
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...