大模型集體失智！9.11和9.9哪個(gè)大，幾乎全翻車了

AIGC動(dòng)態(tài)1年前 (2024)發(fā)布量子位

AIGC動(dòng)態(tài)歡迎閱讀

原標(biāo)題：大模型集體失智！9.11和9.9哪個(gè)大，幾乎全翻車了
關(guān)鍵字：報(bào)告,騰訊,模型,提示,問(wèn)題
文章來(lái)源：量子位
內(nèi)容字?jǐn)?shù)：0字

內(nèi)容摘要：

夢(mèng)晨一水發(fā)自凹非寺量子位 | 公眾號(hào) QbitAI沒(méi)眼看……“9.11和9.9哪個(gè)大”這樣簡(jiǎn)單的問(wèn)題，居然把主流大模型都難倒了？？
強(qiáng)如GPT-4o，都堅(jiān)定地認(rèn)為9.11更大。
谷歌Gemini Advanced付費(fèi)版，同樣的口徑。
新王Claude 3.5 Sonnet，還一本正經(jīng)的給出離譜的計(jì)算方法。
9.11 = 9 + 1/10 + 1/1009.9 = 9 + 9/10
到這一步還是對(duì)的，但下一步突然就不講道理了
如上所示，9.11比9.90大0.01。你想讓我進(jìn)一步詳細(xì)解釋小數(shù)的比較嗎？
這你還解釋啥啊解釋，簡(jiǎn)直要懷疑是全世界AI聯(lián)合起來(lái)人類了。
艾倫AI研究所成員林禹臣換了個(gè)數(shù)字測(cè)試，GPT-4o依舊翻車，他表示：
一方面AI越來(lái)越擅長(zhǎng)做數(shù)學(xué)奧賽題，但另一方面常識(shí)依舊很難。
也有網(wǎng)友發(fā)現(xiàn)了華點(diǎn)，如果是說(shuō)軟件版本號(hào)，那么9.11版本確實(shí)比9.9版本更大（更新）。
而AI都是軟件工程師開(kāi)發(fā)的，所以……
那么，究竟是怎么回事？
先進(jìn)大模型集體翻車???????一覺(jué)醒來(lái)，一眾響當(dāng)當(dāng)?shù)拇竽Ｐ烷_(kāi)始認(rèn)為“9.11>9.9”了？
發(fā)現(xiàn)這個(gè)問(wèn)題的是Riley Goodside，有

原文鏈接：大模型集體失智！9.11和9.9哪個(gè)大，幾乎全翻車了