AIGC動態歡迎閱讀
原標題:阿里剛開源32B大模型,我們立馬測試了“弱智吧”
關鍵字:弱智,模型,嘉賓,峰會,性能
文章來源:量子位
內容字數:4492字
內容摘要:
金磊 發自 凹非寺量子位 | 公眾號 QbitAI阿里的通義千問(Qwen),終于拼齊了1.5系列的最后一塊拼圖——
正式開源Qwen 1.5-32B。
話不多說,直接來看“成績單”。
這次官方pick同臺競技的“選手”是Mixtral 8x7B模型和同為Qwen 1.5系列的72B模型。
從結果上來看,Qwen 1.5-32B已經在多項評測標準中超越或追平Mixtral 8x7B:
并且即便是在與自家更大參數模型PK過程中,Qwen 1.5-32B也用“以小博大”的姿勢展現出了較好的性能。
用通義千問團隊成員的話來說就是:
這個模型顯示出了與72B模型相當的性能,特別是在語言理解、多語言支持、編碼和數學能力等方面。
在推理和部署過程中,成本還會更加友好。
不僅如此,即便是再拉來其它體量相當的大模型“選手”,Qwen 1.5-32B在多項評測中的成績依舊較為亮眼:
除此之外,團隊還做了一項比較有意思的測試——長文本評估任務,“大海撈針”。
簡單來說,這項任務就是將一個與文本無關的句子(“針”)隱藏在大量的文本(“大海”)中,然后通過自然語言提問的方式,觀察AI能否準確提取出這個隱藏的句
聯系作者
文章來源:量子位
作者微信:QbitAI
作者簡介:追蹤人工智能新趨勢,關注科技行業新突破
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...