戴瓊海院士:開源后在 AlpacaEval 直追 GPT4,零一靠技術(shù)如何重建生態(tài)信心
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:戴瓊海院士:開源后在 AlpacaEval 直追 GPT4,零一靠技術(shù)如何重建生態(tài)信心
關(guān)鍵字:模型,報(bào)告,架構(gòu),張量,數(shù)據(jù)
文章來源:人工智能學(xué)家
內(nèi)容字?jǐn)?shù):4412字
內(nèi)容摘要:來源:AI科技大本營(yíng)斯坦福大學(xué)研發(fā)的大語言模型評(píng)測(cè) AlpacaEval Leaderboard 備受業(yè)內(nèi)認(rèn)可,在 2023 年 12 月 7 日 更新的排行榜中,Yi-34B-Chat 以 94.08% 的勝率,超越 LLaMA2 Chat 70B、Claude 2、ChatGPT,在 Alpaca 經(jīng)認(rèn)證的模型類別中,成為僅次于 GPT-4 英語能力的大語言模型。同一周,在加州大學(xué)伯克利分校主導(dǎo)的 LMSYS ORG 排行榜中,Yi-34B-Chat 也以1102 的 Elo 評(píng)分,晉升最新開源 SOTA 開源模型之列,性能表現(xiàn)追平 GPT-3.5。多個(gè)Benchmark遙遙領(lǐng)先在五花八門的大模型評(píng)測(cè)中,伯克利 LMSYS ORG 排行榜采用了一個(gè)最為接近用戶體感的「機(jī)器人競(jìng)技場(chǎng)」特殊測(cè)評(píng)模式,讓眾多大語言模型在評(píng)測(cè)平臺(tái)隨機(jī)進(jìn)行一對(duì)一 battle,通過眾籌真實(shí)用戶來進(jìn)行線上實(shí)時(shí)盲…
原文鏈接:點(diǎn)此閱讀原文:戴瓊海院士:開源后在 AlpacaEval 直追 GPT4,零一靠技術(shù)如何重建生態(tài)信心
聯(lián)系作者
文章來源:人工智能學(xué)家
作者微信:AItists
作者簡(jiǎn)介:致力成為權(quán)威的人工智能科技媒體和前沿科技研究機(jī)構(gòu)