GPT-4o mini憑什么登頂競(jìng)技場(chǎng)?OpenAI刷分秘訣被扒,原來(lái)奧特曼早有暗示
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:GPT-4o mini憑什么登頂競(jìng)技場(chǎng)?OpenAI刷分秘訣被扒,原來(lái)奧特曼早有暗示
關(guān)鍵字:模型,格式,競(jìng)技場(chǎng),表示,情況
文章來(lái)源:量子位
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
明敏 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI為啥GPT-4o mini能登頂大模型競(jìng)技場(chǎng)??
原來(lái)是OpenAI會(huì)刷分呀。
這兩天,lmsys競(jìng)技場(chǎng)公布了一份充滿爭(zhēng)議的榜單。其中才面世不久的GPT-4o mini和滿血版并列第一,把Claude 3.5 Sonnet甩在身后。
結(jié)果網(wǎng)友炸鍋了,大家憑體感覺(jué)得這不可能。
哪怕后面lmsys做過(guò)一次聲明,表示大家別只看總榜,還要更關(guān)注細(xì)分領(lǐng)域的情況。也沒(méi)能讓大家滿意,不少人覺(jué)得lmsys就是從OpenAI那收錢了。
終于,官方曬出了一份完整數(shù)據(jù),展示了GPT-4o mini參與的1000場(chǎng)battle,包括在不同語(yǔ)言下和不同模型的PK情況。
所有人現(xiàn)在都能查看這些結(jié)果。
大家仔細(xì)一瞅,找到了問(wèn)題所在,GPT-4o mini能贏Claude 3.5 Sonnet靠的是三大關(guān)鍵:
拒絕回答次數(shù)更少
更詳細(xì)的回答、總是愿意提供額外信息
回答格式更清晰明了
這……確實(shí)有點(diǎn)道理啊!
網(wǎng)友表示,自己在競(jìng)技場(chǎng)中如果遇到有的模型拒絕回答,他就會(huì)覺(jué)得模型棄權(quán)比賽,因此更愿意判另一個(gè)模型勝出。
而且更清楚的回答格式,也能讓人更容易找到信息。
這不就和老師
原文鏈接:GPT-4o mini憑什么登頂競(jìng)技場(chǎng)?OpenAI刷分秘訣被扒,原來(lái)奧特曼早有暗示
聯(lián)系作者
文章來(lái)源:量子位
作者微信:
作者簡(jiǎn)介: