AIGC動態歡迎閱讀
原標題:菲爾茲獎得主親測GPT-4o,經典過河難題失敗!最強Claude 3.5回答離譜,LeCun嘲諷LLM
關鍵字:農夫,模型,測試,問題,比率
文章來源:新智元
內容字數:0字
內容摘要:
新智元報道編輯:桃子 喬楊
【新智元導讀】LLM能否解決「狼-山羊-卷心菜」經典過河難題?最近,菲爾茲獎得主Timothy Gowers分享了實測GPT-4o的過程,模型在最簡單的題目上竟然做錯了,甚至網友們發現,就連Claude 3.5也無法幸免。在經典的「狼-山羊-卷心菜」過河問題上,如今所有的LLM都失敗了!
幾天前,菲爾茲獎得主、劍橋大學研究主任Timothy Gowers直接拿GPT-4o開刀,去解決動物過河難題。
在此,他給出了一個新的基準——廢話比率(crapness ratio),即LLM給出的總答案與正確答案之間的比率。
經過測試,Gowers發現大模型的廢話比率可以達到5倍。
一開始,他先給出了一個農民帶2只雞過河,一只船只能容納一個人和2個動物,那么農夫帶著兩只雞渡河所需的最少渡河次數是多少?
別說成年人了,就拿低幼小孩子來說,一聽完題目,就立馬給出正確的答案。
搞笑的是,ChatGPT的回答分解了5個步驟,讓人看著極其愚蠢荒謬。
第一次渡河:農夫帶著兩只雞一起過河;現狀:農夫和兩只雞在河對岸。
第二次渡河:農夫把兩只雞留在對岸,然后獨自返回;現狀:農夫在起始岸
原文鏈接:菲爾茲獎得主親測GPT-4o,經典過河難題失敗!最強Claude 3.5回答離譜,LeCun嘲諷LLM
聯系作者
文章來源:新智元
作者微信:AI_era
作者簡介:智能+中國主平臺,致力于推動中國從互聯網+邁向智能+新紀元。重點關注人工智能、機器人等前沿領域發展,關注人機融合、人工智能和機器人對人類社會與文明進化的影響,領航中國新智能時代。
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...