阿里剛開源32B大模型,我們立馬測(cè)試了“弱智吧”
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:阿里剛開源32B大模型,我們立馬測(cè)試了“弱智吧”
關(guān)鍵字:弱智,模型,嘉賓,峰會(huì),性能
文章來源:量子位
內(nèi)容字?jǐn)?shù):4492字
內(nèi)容摘要:
金磊 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI阿里的通義千問(Qwen),終于拼齊了1.5系列的最后一塊拼圖——
正式開源Qwen 1.5-32B。
話不多說,直接來看“成績(jī)單”。
這次官方pick同臺(tái)競(jìng)技的“選手”是Mixtral 8x7B模型和同為Qwen 1.5系列的72B模型。
從結(jié)果上來看,Qwen 1.5-32B已經(jīng)在多項(xiàng)評(píng)測(cè)標(biāo)準(zhǔn)中超越或追平Mixtral 8x7B:
并且即便是在與自家更大參數(shù)模型PK過程中,Qwen 1.5-32B也用“以小博大”的姿勢(shì)展現(xiàn)出了較好的性能。
用通義千問團(tuán)隊(duì)成員的話來說就是:
這個(gè)模型顯示出了與72B模型相當(dāng)?shù)男阅?,特別是在語(yǔ)言理解、多語(yǔ)言支持、編碼和數(shù)學(xué)能力等方面。
在推理和部署過程中,成本還會(huì)更加友好。
不僅如此,即便是再拉來其它體量相當(dāng)?shù)拇竽P汀斑x手”,Qwen 1.5-32B在多項(xiàng)評(píng)測(cè)中的成績(jī)依舊較為亮眼:
除此之外,團(tuán)隊(duì)還做了一項(xiàng)比較有意思的測(cè)試——長(zhǎng)文本評(píng)估任務(wù),“大海撈針”。
簡(jiǎn)單來說,這項(xiàng)任務(wù)就是將一個(gè)與文本無(wú)關(guān)的句子(“針”)隱藏在大量的文本(“大?!保┲?,然后通過自然語(yǔ)言提問的方式,觀察AI能否準(zhǔn)確提取出這個(gè)隱藏的句
原文鏈接:阿里剛開源32B大模型,我們立馬測(cè)試了“弱智吧”
聯(lián)系作者
文章來源:量子位
作者微信:QbitAI
作者簡(jiǎn)介:追蹤人工智能新趨勢(shì),關(guān)注科技行業(yè)新突破