GPT-4o mini憑什么登頂競(jìng)技場(chǎng)？OpenAI刷分秘訣被扒，原來奧特曼早有暗示

AIGC動(dòng)態(tài)1年前 (2024)發(fā)布量子位

AIGC動(dòng)態(tài)歡迎閱讀

原標(biāo)題：GPT-4o mini憑什么登頂競(jìng)技場(chǎng)？OpenAI刷分秘訣被扒，原來奧特曼早有暗示
關(guān)鍵字：模型,格式,競(jìng)技場(chǎng),表示,情況
文章來源：量子位
內(nèi)容字?jǐn)?shù)：0字

內(nèi)容摘要：

明敏發(fā)自凹非寺量子位 | 公眾號(hào) QbitAI為啥GPT-4o mini能登頂大模型競(jìng)技場(chǎng)？？
原來是OpenAI會(huì)刷分呀。
這兩天，lmsys競(jìng)技場(chǎng)公布了一份充滿爭(zhēng)議的榜單。其中才面世不久的GPT-4o mini和滿血版并列第一，把Claude 3.5 Sonnet甩在身后。
結(jié)果網(wǎng)友炸鍋了，大家憑體感覺得這不可能。
哪怕后面lmsys做過一次聲明，表示大家別只看總榜，還要更關(guān)注細(xì)分領(lǐng)域的情況。也沒能讓大家滿意，不少人覺得lmsys就是從OpenAI那收錢了。
終于，官方曬出了一份完整數(shù)據(jù)，展示了GPT-4o mini參與的1000場(chǎng)battle，包括在不同語言下和不同模型的PK情況。
所有人現(xiàn)在都能查看這些結(jié)果。
大家仔細(xì)一瞅，找到了問題所在，GPT-4o mini能贏Claude 3.5 Sonnet靠的是三大關(guān)鍵：
拒絕回答次數(shù)更少
更詳細(xì)的回答、總是愿意提供額外信息
回答格式更清晰明了
這……確實(shí)有點(diǎn)道理啊！
網(wǎng)友表示，自己在競(jìng)技場(chǎng)中如果遇到有的模型拒絕回答，他就會(huì)覺得模型棄權(quán)比賽，因此更愿意判另一個(gè)模型勝出。
而且更清楚的回答格式，也能讓人更容易找到信息。
這不就和老師

原文鏈接：GPT-4o mini憑什么登頂競(jìng)技場(chǎng)？OpenAI刷分秘訣被扒，原來奧特曼早有暗示