AIGC動態歡迎閱讀
原標題:人類考92分的題,GPT-4只能考15分:測試一升級,大模型全都現原形了
文章來源:機器之心
內容字數:8148字
內容摘要:機器之心報道編輯:張倩、澤南AutoGPT 的得分也涼涼。GPT-4 自誕生以來一直是位「優等生」,在各種考試(基準)中都能得高分。但現在,它在一份新的測試中只拿到了 15 分,而人類能拿 92。這套名叫「GAIA」的測試題由來自 Meta-FAIR、Meta-GenAI、HuggingFace 和 AutoGPT 的團隊制作,提出了一些需要一系列基本能力才能解決的問題,如推理、多模態處理、網頁瀏覽和一般工具使用能力。這些問題對人類來說非常簡單,但對大多數高級 AI 來說卻極具挑戰性。如果里面的問題都能解決,通關的模型將成為 AI 研究的重要里程碑。GAIA 的設計理念和當前的很多 AI 基準不一樣,后者往往傾向于設計一些對人類來說越來越難的任務,這背后其實反映了當前社區對 AGI 理解的差異。GAIA 背后的團隊認為,AGI 的出現取決于系統能否在上述「簡單」問題上表現出與普通人類似的穩…
原文鏈接:點此閱讀原文:人類考92分的題,GPT-4只能考15分:測試一升級,大模型全都現原形了
聯系作者
文章來源:機器之心
作者微信:almosthuman2014
作者簡介:專業的人工智能媒體和產業服務平臺
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...