GPT-4o 引爆小紅書打卡潮,推動 Vision Pro想象,刷新微軟、Adobe 產(chǎn)品線
AIGC動態(tài)歡迎閱讀
原標(biāo)題:GPT-4o 引爆小紅書打卡潮,推動 Vision Pro想象,刷新微軟、Adobe 產(chǎn)品線
關(guān)鍵字:能力,模型,圖像,人群,智能
文章來源:AI科技評論
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
GPT-4o 多模態(tài)視覺能力激發(fā)多重想象。作者丨許一揚
編輯丨陳彩嫻1小紅書打卡潮GPT-4o 發(fā)布以后,雖然業(yè)內(nèi)一片噓聲,小紅書上卻掀起了一股打卡熱潮。社交媒體小紅書上,多個貼文以及下面的評論區(qū)爭相考驗 GPT-4o 的“眼力”。Cr. 阿遙(小紅書ID: 958377307)
左右滑動查看更多相比 Gemini 等一眾多模態(tài) AI 模型,GPT-4o 的輸出難以置信的準(zhǔn)確,超半數(shù)情況下 zero-shot 直接命中,附線索提示的 few-shot 則基本上全部命中。
而其余國外廠商的多模態(tài)大模型錯誤率較高。
值得注意的是,GPT-4o 的識別結(jié)果也并不穩(wěn)定,且較容易受到提示語的影響。特別是使用中文進行提問,GPT-4o 傾向于先猜測東南亞地點,經(jīng)提示以后才能命中答案。GPT-4o 一次性命中,Gemini 1.5 Pro 識別失敗,GPT-4o 中文 few-shot 命中(Cr. 小紅書“鼠撥土和她的CEO朋友們”)左右滑動查看更多相比之下,小紅書博主 206265 使用英語對在美國拍攝的7張照片進行提問,GPT-4o 的所有回答全部正確。
這些案例表明,只要某一地點在網(wǎng)上有一定
原文鏈接:GPT-4o 引爆小紅書打卡潮,推動 Vision Pro想象,刷新微軟、Adobe 產(chǎn)品線
聯(lián)系作者
文章來源:AI科技評論
作者微信:aitechtalk
作者簡介:雷峰網(wǎng)旗下AI新媒體。聚焦AI前沿研究,關(guān)注AI工程落地。