國(guó)產(chǎn)大模型之光!伯克利最新基準(zhǔn)發(fā)布,智譜AI打贏GPT-4和Llama 3

AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:國(guó)產(chǎn)大模型之光!伯克利最新基準(zhǔn)發(fā)布,智譜AI打贏GPT-4和Llama 3
關(guān)鍵字:模型,報(bào)告,騰訊,小米,解讀
文章來(lái)源:智東西
內(nèi)容字?jǐn)?shù):8764字
內(nèi)容摘要:
讓Llama 3祛魅的新基準(zhǔn),“中國(guó)OpenAI”交卷了。
作者|香草
編輯|漠影
近日,Meta開源Llama 3系列模型,引發(fā)開源社區(qū)沸騰。
同時(shí)也有唱衰國(guó)產(chǎn)大模型的聲音出現(xiàn),認(rèn)為L(zhǎng)lama 3的開源“又”將為國(guó)產(chǎn)大模型帶來(lái)“新突破”。但事實(shí)果真如此嗎?
智東西4月30日?qǐng)?bào)道,上周,來(lái)自UC伯克利等機(jī)構(gòu)的團(tuán)隊(duì)LMSYS開源了大模型基準(zhǔn)測(cè)試Arena-Hard,以高度的人類偏好一致性、可分性為優(yōu)勢(shì),同時(shí)測(cè)試數(shù)據(jù)集更新頻率高,具備優(yōu)秀的開放性、動(dòng)態(tài)性、科學(xué)性和權(quán)威性。
根據(jù)該基準(zhǔn)測(cè)試,國(guó)產(chǎn)大模型ChatGLM3、GLM-4排名僅次于GPT-4 Turbo和Claude 3 Opus,在國(guó)內(nèi)外模型中均處于領(lǐng)先地位。
同樣在上周發(fā)布的還有《SuperBench大模型綜合能力評(píng)測(cè)報(bào)告》,由清華大學(xué)基礎(chǔ)模型研究中心聯(lián)合中關(guān)村實(shí)驗(yàn)室研制。在語(yǔ)義、代碼、對(duì)齊、智能體和安全五個(gè)榜單中,GLM-4有3項(xiàng)排名國(guó)內(nèi)第一,其中語(yǔ)義理解能力更是僅次于Claude 3位列全球第二。
GLM系列模型是智譜AI自研的基座大模型,其中GLM-4是其在今年1月推出的最新一代,具備多模態(tài)、長(zhǎng)文本、智能體等能力。
這表明,
原文鏈接:國(guó)產(chǎn)大模型之光!伯克利最新基準(zhǔn)發(fā)布,智譜AI打贏GPT-4和Llama 3
聯(lián)系作者
文章來(lái)源:智東西
作者微信:zhidxcom
作者簡(jiǎn)介:智能產(chǎn)業(yè)新媒體!智東西專注報(bào)道人工智能主導(dǎo)的前沿技術(shù)發(fā)展,和技術(shù)應(yīng)用帶來(lái)的千行百業(yè)產(chǎn)業(yè)升級(jí)。聚焦智能變革,服務(wù)產(chǎn)業(yè)升級(jí)。

粵公網(wǎng)安備 44011502001135號(hào)