GPT-4抽象推理PK人類差距巨大!多模態(tài)遠不如純文本,AGI火花難以燃燒

AIGC動態(tài)歡迎閱讀
原標題:GPT-4抽象推理PK人類差距巨大!多模態(tài)遠不如純文本,AGI火花難以燃燒
關(guān)鍵字:任務(wù),人類,模型,測試,文本
文章來源:新智元
內(nèi)容字數(shù):3823字
內(nèi)容摘要:
新智元報道編輯:Mindy 潤
【新智元導(dǎo)讀】圣達菲研究所的科研人員用非常嚴謹?shù)亩垦芯糠椒ǎ瑴y試出了GPT-4在推理和抽象方面與人類水平還有較大差距。要想從GPT-4的水平發(fā)展出AGI,還任重道遠!GPT-4,可能是目前最強大的通用語言大模型。一經(jīng)發(fā)布,除了感嘆它在各種任務(wù)上的出色表現(xiàn)之外,大家也紛紛提出疑問:GPT-4是AGI嗎?他真的預(yù)示了AI取代人類那一天的到來嗎?
上也有一眾網(wǎng)友發(fā)起了投票:
其中,反對的觀點主要在于:
– 有限的推理能力:GPT-4被詬病最多的就是不能執(zhí)行「反向推理」,而且難以形成對世界的抽象模型進行估計。
– 任務(wù)特定的泛化:雖然GPT-4可以在形式上進行泛化,但在跨任務(wù)的目標方面可能會遇到困難。
那到底GPT-4的推理能力和抽象能力和人類相比,有多大的差距,大家的這種感性似乎一直沒有定量的研究作為支撐。
而最近圣達菲研究所的科研人員,系統(tǒng)性地對比了人類和GPT-4在推理和抽象泛化方面的差距。
論文鏈接:https://arxiv.org/abs/2311.09247
研究人員在GPT-4的抽象推理能力方面,通過ConceptARC基準測試評估了GP
原文鏈接:GPT-4抽象推理PK人類差距巨大!多模態(tài)遠不如純文本,AGI火花難以燃燒
聯(lián)系作者
文章來源:新智元
作者微信:AI_era
作者簡介:智能+中國主平臺,致力于推動中國從互聯(lián)網(wǎng)+邁向智能+新紀元。重點關(guān)注人工智能、機器人等前沿領(lǐng)域發(fā)展,關(guān)注人機融合、人工智能和機器人對人類社會與文明進化的影響,領(lǐng)航中國新智能時代。

粵公網(wǎng)安備 44011502001135號