大模型集體失智!9.11和9.9哪個(gè)大,幾乎全翻車了

AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:大模型集體失智!9.11和9.9哪個(gè)大,幾乎全翻車了
關(guān)鍵字:報(bào)告,騰訊,模型,提示,問(wèn)題
文章來(lái)源:量子位
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
夢(mèng)晨 一水 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI沒(méi)眼看……“9.11和9.9哪個(gè)大”這樣簡(jiǎn)單的問(wèn)題,居然把主流大模型都難倒了??
強(qiáng)如GPT-4o,都堅(jiān)定地認(rèn)為9.11更大。
谷歌Gemini Advanced付費(fèi)版,同樣的口徑。
新王Claude 3.5 Sonnet,還一本正經(jīng)的給出離譜的計(jì)算方法。
9.11 = 9 + 1/10 + 1/1009.9 = 9 + 9/10
到這一步還是對(duì)的,但下一步突然就不講道理了
如上所示,9.11比9.90大0.01。你想讓我進(jìn)一步詳細(xì)解釋小數(shù)的比較嗎?
這你還解釋啥啊解釋,簡(jiǎn)直要懷疑是全世界AI聯(lián)合起來(lái)人類了。
艾倫AI研究所成員林禹臣換了個(gè)數(shù)字測(cè)試,GPT-4o依舊翻車,他表示:
一方面AI越來(lái)越擅長(zhǎng)做數(shù)學(xué)奧賽題,但另一方面常識(shí)依舊很難。
也有網(wǎng)友發(fā)現(xiàn)了華點(diǎn),如果是說(shuō)軟件版本號(hào),那么9.11版本確實(shí)比9.9版本更大(更新)。
而AI都是軟件工程師開(kāi)發(fā)的,所以……
那么,究竟是怎么回事?
先進(jìn)大模型集體翻車???????一覺(jué)醒來(lái),一眾響當(dāng)當(dāng)?shù)拇竽P烷_(kāi)始認(rèn)為“9.11>9.9”了?
發(fā)現(xiàn)這個(gè)問(wèn)題的是Riley Goodside,有
原文鏈接:大模型集體失智!9.11和9.9哪個(gè)大,幾乎全翻車了
聯(lián)系作者
文章來(lái)源:量子位
作者微信:QbitAI
作者簡(jiǎn)介:追蹤人工智能新趨勢(shì),關(guān)注科技行業(yè)新突破

粵公網(wǎng)安備 44011502001135號(hào)