AI搞定谷歌驗證碼,最新多模態(tài)大模型比GPT-4V空間理解更準(zhǔn)確 | 蘋果AI/ML團(tuán)隊
AIGC動態(tài)歡迎閱讀
原標(biāo)題:AI搞定谷歌驗證碼,最新多模態(tài)大模型比GPT-4V空間理解更準(zhǔn)確 | 蘋果AI/ML團(tuán)隊
關(guān)鍵字:模型,區(qū)域,坐標(biāo),圖像,特征
文章來源:量子位
內(nèi)容字?jǐn)?shù):3999字
內(nèi)容摘要:Michael 投稿自 凹非寺量子位 | 公眾號 QbitAI谷歌人機(jī)驗證已經(jīng)攔不住AI了!最新多模態(tài)大模型,能輕松找到圖中所有交通信號燈,還準(zhǔn)確圈出了具置。表現(xiàn)直接超越GPT-4V。這就是由蘋果和哥倫比亞大學(xué)研究團(tuán)隊帶來的多模態(tài)大模型“雪貂”(Ferret)。它具備更強(qiáng)的圖文關(guān)聯(lián)能力,提升了大模型在“看說答”任務(wù)中的精確度。比如下圖中非常細(xì)小的部件(region 1),它也可以分辨出來是避震…
原文鏈接:點此閱讀原文:AI搞定谷歌驗證碼,最新多模態(tài)大模型比GPT-4V空間理解更準(zhǔn)確 | 蘋果AI/ML團(tuán)隊
聯(lián)系作者
文章來源:量子位
作者微信:QbitAI
作者簡介:追蹤人工智能新趨勢,關(guān)注科技行業(yè)新突破
? 版權(quán)聲明
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載。
相關(guān)文章
暫無評論...