GPT-4推理能力為0?開發(fā)者懸賞1萬美金被打臉,神秘提示正確率直沖100%
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:GPT-4推理能力為0?開發(fā)者懸賞1萬美金被打臉,神秘提示正確率直沖100%
關(guān)鍵字:模型,問題,小哥,提示,成功率
文章來源:新智元
內(nèi)容字?jǐn)?shù):7653字
內(nèi)容摘要:
新智元報(bào)道編輯:Aeneas 好困
【新智元導(dǎo)讀】小孩子都會(huì)的腦筋急轉(zhuǎn)彎推理題,GPT-4和Claude 3做不出?國(guó)外一位開發(fā)者小哥堅(jiān)稱這一觀點(diǎn),認(rèn)為GPT模型在訓(xùn)練集外毫無推理能力,無法實(shí)現(xiàn)AGI,甚至懸賞1萬美元,發(fā)起比賽。然而,他當(dāng)天就被光速打臉了!網(wǎng)友用高能的prompt,讓GPT-4和Claude 3幾乎達(dá)到百分百的正確率。ChatGPT,再一次打破人們對(duì)它的成見!
它用自己的優(yōu)秀表現(xiàn)證明了,很多時(shí)候自己看似失敗的表現(xiàn),只是因?yàn)槿祟惒粫?huì)正確地prompt而已。
這位名叫Taelin的程序員、初創(chuàng)公司Higher Order的創(chuàng)始人表示,下面這個(gè)腦筋急轉(zhuǎn)彎,大多數(shù)孩子都能在一分鐘內(nèi)解決,然而所有的AI卻都慘遭失敗。
這也就成了他給GPT「判」的一個(gè)鐵證——
GPT模型在訓(xùn)練集之外,沒有任何推理能力。GPT永遠(yuǎn)無法實(shí)現(xiàn)AGI。7萬億肯定是白燒的,是時(shí)候?qū)ふ倚碌乃惴恕?br />為此,他向公眾社區(qū)發(fā)出了一項(xiàng)挑戰(zhàn),任何能用LLM解決這個(gè)難題的人,將獲得10000美元的獎(jiǎng)金。
然而——他!被!打!臉!了!
兩天后,一位網(wǎng)友僅通過提示,就讓模型解決這道問題時(shí)達(dá)到了接近100%的成功率。
原文鏈接:GPT-4推理能力為0?開發(fā)者懸賞1萬美金被打臉,神秘提示正確率直沖100%
聯(lián)系作者
文章來源:新智元
作者微信:AI_era
作者簡(jiǎn)介:智能+中國(guó)主平臺(tái),致力于推動(dòng)中國(guó)從互聯(lián)網(wǎng)+邁向智能+新紀(jì)元。重點(diǎn)關(guān)注人工智能、機(jī)器人等前沿領(lǐng)域發(fā)展,關(guān)注人機(jī)融合、人工智能和機(jī)器人對(duì)人類社會(huì)與文明進(jìn)化的影響,領(lǐng)航中國(guó)新智能時(shí)代。