AIGC動態歡迎閱讀
原標題:大模型玩你畫我猜:Claude6局3勝,GPT-4o表現迷惑
關鍵字:模型,游戲,表示,測試,網友
文章來源:量子位
內容字數:0字
內容摘要:
奇月 發自 凹非寺量子位 | 公眾號 QbitAI一群大模型玩你畫我猜,人類一旁圍觀超起勁兒。
就像下面這張圖展示的,由Grok畫長頸鹿,一堆大模型根據生成內容猜答案。參賽選手包括GPT-4o、Claude、Llama、Gemini、Grok等。
其實這是最近爆火的一種新的測試基準(doge)。
游戲結果一定程度上能反映出大模型能力,比如這組測試一共進行了6局游戲,表現最好的是Claude:它贏了3次!
GPT-4o表現有點抽象。就它畫的這龍卷風,人類也看不懂。
不止如此,在很多輪游戲中,其他模型都在認認真真地答題,而它的第一個回答經常是Circle??有點子抽象。
所以有人就說,這游戲可以當測試基準來用啊。
還有人表示,AI照這個速度發展,人類就只能當圍觀的瓦力了。來看看更多有趣的例子在比較簡單的題目上,所有模型都在一兩個回合中就猜對了答案,比如下面的房子:
還有非常簡潔的草地、海洋:
動物主題相對復雜一些,模型們一般需要猜4-5輪,比如大象這題:
游戲整體效果非常棒,網友們也是好評如潮:
你畫我猜項目起源模型畫畫早已不是新鮮事,但讓大模型玩你畫我猜?這天才想法是怎么產生的?
首先,
原文鏈接:大模型玩你畫我猜:Claude6局3勝,GPT-4o表現迷惑
聯系作者
文章來源:量子位
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...