智譜GLM vs Qwen：誰(shuí)將主宰端側(cè)大模型的未來(lái)？

AIGC動(dòng)態(tài)10個(gè)月前發(fā)布智猩猩GenAI

GLM-Edge系列在部分端側(cè)平臺(tái)上實(shí)現(xiàn)了高速運(yùn)行

原標(biāo)題：智譜GLM入局端側(cè)大模型，對(duì)戰(zhàn)Qwen效果如何？
文章來(lái)源：智猩猩GenAI
內(nèi)容字?jǐn)?shù)：6944字

2024中國(guó)生成式AI大會(huì)（上海站）預(yù)告

智猩猩聯(lián)合主辦的2024中國(guó)生成式AI大會(huì)將于12月5日至6日在上海舉行。大會(huì)將設(shè)有主會(huì)場(chǎng)和分會(huì)場(chǎng)，主會(huì)場(chǎng)將進(jìn)行大模型峰會(huì)和AI Infra峰會(huì)，而分會(huì)場(chǎng)將圍繞端側(cè)生成式AI、AI視頻生成和具身智能等主題展開(kāi)技術(shù)研討。歡迎各界人士報(bào)名參與。

GLM-Edge大語(yǔ)言模型系列簡(jiǎn)介

GLM-Edge是智譜AI近期推出的一系列大語(yǔ)言模型，專為端側(cè)應(yīng)用場(chǎng)景設(shè)計(jì)。該系列包括1.5B和4B的語(yǔ)言模型，以及2B和5B的多模態(tài)模型，特別適配移動(dòng)平臺(tái)和PC等不同計(jì)算能力的設(shè)備。其在驍龍8 Elite芯片平臺(tái)上的解碼速度表現(xiàn)出色，達(dá)到每秒60個(gè)token以上。

GLM-Edge的創(chuàng)新與優(yōu)化

GLM-Edge系列的推出旨在平衡模型性能與實(shí)際推理效果。通過(guò)與行業(yè)伙伴的緊密合作和持續(xù)的推理優(yōu)化，GLM-Edge在多個(gè)端側(cè)平臺(tái)上實(shí)現(xiàn)了高速運(yùn)行。盡管在測(cè)試中GLM-Edge的整體表現(xiàn)尚未達(dá)到同尺寸模型Qwen的水平，但未來(lái)的迭代優(yōu)化將有潛力提升其性能。

效果與性能測(cè)試結(jié)果

在文本摘要和信息抽取任務(wù)中，GLM-Edge的表現(xiàn)不及Qwen，存在一定的幻覺(jué)現(xiàn)象。例如，在文本摘要任務(wù)中，GLM-Edge-1.5B的輸出結(jié)果與原文存在偏差，而Qwen的輸出則更為準(zhǔn)確。在信息抽取任務(wù)中，GLM-Edge未能提取出準(zhǔn)確的目標(biāo)地址，顯示出其在特定任務(wù)上的局限性。

總結(jié)與展望

總體而言，GLM-Edge系列在性能和實(shí)用性方面還有提升的空間。盡管目前的表現(xiàn)不如Qwen，但隨著后續(xù)版本的優(yōu)化，GLM-Edge有望在端側(cè)生成式AI領(lǐng)域取得更大的進(jìn)展。高通和Intel平臺(tái)上的性能測(cè)試結(jié)果也展示了該系列模型在不同硬件上的適應(yīng)能力。

歡迎大家關(guān)注即將到來(lái)的2024中國(guó)生成式AI大會(huì)，共同探討生成式AI的未來(lái)發(fā)展與應(yīng)用。