蘋(píng)果一篇論文把大模型圈子得罪了!“踩著”O(jiān)penAI、Meta大模型上位,Gary Marcus:早就說(shuō)大模型不會(huì)推理!
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:蘋(píng)果一篇論文把大模型圈子得罪了!“踩著”OpenAI、Meta大模型上位,Gary Marcus:早就說(shuō)大模型不會(huì)推理!
關(guān)鍵字:模型,小米,論文,報(bào)告,人工智能
文章來(lái)源:AI前線
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
整理 | 褚杏娟、平川
蘋(píng)果公司六位勇于挑戰(zhàn)主流的 AI 研究人員 Iman Mirzadeh、Keivan Alizadeh、Hooman Shahrokhi、Oncel Tuzel、Samy Bengio 和 Mehrdad Farajtabar,近日發(fā)表了一篇關(guān)于 LLM 的精彩論文。其中有一段很關(guān)鍵:
我們?cè)谡Z(yǔ)言模型中沒(méi)有發(fā)現(xiàn)任何形式推理的東西……它們的行為更適合用復(fù)雜的模式匹配來(lái)解釋……事實(shí)上,這種模式匹配非常脆弱,改個(gè)名稱就可能改變結(jié)果約 10%!
他們得出的結(jié)論在人工智能社區(qū)引起軒然,很多人對(duì)論文本身提出了很大的質(zhì)疑。
論文地址:https://arxiv.org/pdf/2410.05229
蘋(píng)果的研究人員對(duì)一系列領(lǐng)先語(yǔ)言模型,包括來(lái)自 OpenAI、Meta 和其他知名廠商的模型進(jìn)行研究測(cè)試,以確定這些模型處理數(shù)學(xué)推理任務(wù)的能力。結(jié)果表明,問(wèn)題措辭的細(xì)微變化都會(huì)導(dǎo)致模型性能出現(xiàn)重大差異,從而削弱模型在需要邏輯一致性場(chǎng)景中的可靠性。
蘋(píng)果研究人員提醒大家注意語(yǔ)言模型中一個(gè)長(zhǎng)期存在的問(wèn)題:它們依賴模式匹配,而不是真正的邏輯推理。在幾項(xiàng)測(cè)試中,研究人員證明,在問(wèn)題中
原文鏈接:蘋(píng)果一篇論文把大模型圈子得罪了!“踩著”O(jiān)penAI、Meta大模型上位,Gary Marcus:早就說(shuō)大模型不會(huì)推理!
聯(lián)系作者
文章來(lái)源:AI前線
作者微信:
作者簡(jiǎn)介: