大模型集體失智!9.11和9.9哪個大,幾乎全翻車了
AIGC動態(tài)歡迎閱讀
原標題:大模型集體失智!9.11和9.9哪個大,幾乎全翻車了
關(guān)鍵字:報告,騰訊,模型,提示,問題
文章來源:量子位
內(nèi)容字數(shù):0字
內(nèi)容摘要:
夢晨 一水 發(fā)自 凹非寺量子位 | 公眾號 QbitAI沒眼看……“9.11和9.9哪個大”這樣簡單的問題,居然把主流大模型都難倒了??
強如GPT-4o,都堅定地認為9.11更大。
谷歌Gemini Advanced付費版,同樣的口徑。
新王Claude 3.5 Sonnet,還一本正經(jīng)的給出離譜的計算方法。
9.11 = 9 + 1/10 + 1/1009.9 = 9 + 9/10
到這一步還是對的,但下一步突然就不講道理了
如上所示,9.11比9.90大0.01。你想讓我進一步詳細解釋小數(shù)的比較嗎?
這你還解釋啥啊解釋,簡直要懷疑是全世界AI聯(lián)合起來人類了。
艾倫AI研究所成員林禹臣換了個數(shù)字測試,GPT-4o依舊翻車,他表示:
一方面AI越來越擅長做數(shù)學奧賽題,但另一方面常識依舊很難。
也有網(wǎng)友發(fā)現(xiàn)了華點,如果是說軟件版本號,那么9.11版本確實比9.9版本更大(更新)。
而AI都是軟件工程師開發(fā)的,所以……
那么,究竟是怎么回事?
先進大模型集體翻車???????一覺醒來,一眾響當當?shù)拇竽P烷_始認為“9.11>9.9”了?
發(fā)現(xiàn)這個問題的是Riley Goodside,有
原文鏈接:大模型集體失智!9.11和9.9哪個大,幾乎全翻車了
聯(lián)系作者
文章來源:量子位
作者微信:QbitAI
作者簡介:追蹤人工智能新趨勢,關(guān)注科技行業(yè)新突破
? 版權(quán)聲明
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載。
相關(guān)文章
暫無評論...