阿里剛開源32B大模型,我們立馬測試了“弱智吧”

AIGC動態(tài)歡迎閱讀
原標(biāo)題:阿里剛開源32B大模型,我們立馬測試了“弱智吧”
關(guān)鍵字:弱智,模型,嘉賓,峰會,性能
文章來源:量子位
內(nèi)容字?jǐn)?shù):4492字
內(nèi)容摘要:
金磊 發(fā)自 凹非寺量子位 | 公眾號 QbitAI阿里的通義千問(Qwen),終于拼齊了1.5系列的最后一塊拼圖——
正式開源Qwen 1.5-32B。
話不多說,直接來看“成績單”。
這次官方pick同臺競技的“選手”是Mixtral 8x7B模型和同為Qwen 1.5系列的72B模型。
從結(jié)果上來看,Qwen 1.5-32B已經(jīng)在多項評測標(biāo)準(zhǔn)中超越或追平Mixtral 8x7B:
并且即便是在與自家更大參數(shù)模型PK過程中,Qwen 1.5-32B也用“以小博大”的姿勢展現(xiàn)出了較好的性能。
用通義千問團隊成員的話來說就是:
這個模型顯示出了與72B模型相當(dāng)?shù)男阅埽貏e是在語言理解、多語言支持、編碼和數(shù)學(xué)能力等方面。
在推理和部署過程中,成本還會更加友好。
不僅如此,即便是再拉來其它體量相當(dāng)?shù)拇竽P汀斑x手”,Qwen 1.5-32B在多項評測中的成績依舊較為亮眼:
除此之外,團隊還做了一項比較有意思的測試——長文本評估任務(wù),“大海撈針”。
簡單來說,這項任務(wù)就是將一個與文本無關(guān)的句子(“針”)隱藏在大量的文本(“大海”)中,然后通過自然語言提問的方式,觀察AI能否準(zhǔn)確提取出這個隱藏的句
聯(lián)系作者
文章來源:量子位
作者微信:QbitAI
作者簡介:追蹤人工智能新趨勢,關(guān)注科技行業(yè)新突破
? 版權(quán)聲明
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載。
相關(guān)文章
暫無評論...

粵公網(wǎng)安備 44011502001135號