大模型玩你畫我猜：Claude6局3勝，GPT-4o表現迷惑

AIGC動態1年前 (2024)發布量子位

AIGC動態歡迎閱讀

原標題：大模型玩你畫我猜：Claude6局3勝，GPT-4o表現迷惑
關鍵字：模型,游戲,表示,測試,網友
文章來源：量子位
內容字數：0字

內容摘要：

奇月發自凹非寺量子位 | 公眾號 QbitAI一群大模型玩你畫我猜，人類一旁圍觀超起勁兒。
就像下面這張圖展示的，由Grok畫長頸鹿，一堆大模型根據生成內容猜答案。參賽選手包括GPT-4o、Claude、Llama、Gemini、Grok等。
其實這是最近爆火的一種新的測試基準（doge）。
游戲結果一定程度上能反映出大模型能力，比如這組測試一共進行了6局游戲，表現最好的是Claude：它贏了3次！
GPT-4o表現有點抽象。就它畫的這龍卷風，人類也看不懂。
不止如此，在很多輪游戲中，其他模型都在認認真真地答題，而它的第一個回答經常是Circle？？有點子抽象。
所以有人就說，這游戲可以當測試基準來用啊。
還有人表示，AI照這個速度發展，人類就只能當圍觀的瓦力了。來看看更多有趣的例子在比較簡單的題目上，所有模型都在一兩個回合中就猜對了答案，比如下面的房子：
還有非常簡潔的草地、海洋：
動物主題相對復雜一些，模型們一般需要猜4-5輪，比如大象這題：
游戲整體效果非常棒，網友們也是好評如潮：
你畫我猜項目起源模型畫畫早已不是新鮮事，但讓大模型玩你畫我猜？這天才想法是怎么產生的？
首先，

原文鏈接：大模型玩你畫我猜：Claude6局3勝，GPT-4o表現迷惑