13.11 和 13.8 哪個大,不只是人類,為什么連大模型也翻車了?
AIGC動態歡迎閱讀
原標題:13.11 和 13.8 哪個大,不只是人類,為什么連大模型也翻車了?
關鍵字:解讀,騰訊,模型,問題,提示
文章來源:Founder Park
內容字數:0字
內容摘要:
以下文章轉載自公眾號「量子位」,Founder Park 略有增刪。7月12日晚,《歌手 2024》第十期競演排名公布,每位選手的名字后是得票率,有觀眾在社交媒體評論區針對13.8和13.11的大小,真誠地發出疑問。評論區非常熱鬧,很多人竟然因此吵了起來。
但更令人震驚的是,有人拿這個問題問AI,大模型竟然也犯了錯誤。
無獨有偶,在 X()上,不少用戶也在討論大模型沒法比較數字大小的問題。比如“9.11和9.9哪個大”,這樣簡單的問題,把主流大模型紛紛難倒。
強如GPT-4o,都堅定地認為9.11更大。
谷歌Gemini Advanced付費版,同樣的口徑。
新王Claude 3.5 Sonnet,還一本正經的給出離譜的計算方法。
“9.11 = 9 + 1/10 + 1/100
9.9 = 9 + 9/10”
到這一步還是對的,但下一步突然就不講道理了
“如上所示,9.11比9.90大0.01。
你想讓我進一步詳細解釋小數的比較嗎?”
這你還解釋啥啊解釋,簡直要懷疑是全世界AI聯合起來人類了。
這個bug,究竟是怎么回事?01國內外先進大模型集體翻車一覺醒來,一眾響當當的大模
原文鏈接:13.11 和 13.8 哪個大,不只是人類,為什么連大模型也翻車了?
聯系作者
文章來源:Founder Park
作者微信:Founder-Park
作者簡介:來自極客公園,專注與科技創業者聊「真問題」。
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...