<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        這些VLM竟都是盲人?GPT-4o、Sonnet-3.5相繼敗于「視力」測試

        AIGC動態(tài)11個月前發(fā)布 機(jī)器之心
        465 0 0

        這些VLM竟都是盲人?GPT-4o、Sonnet-3.5相繼敗于「視力」測試

        AIGC動態(tài)歡迎閱讀

        原標(biāo)題:這些VLM竟都是盲人?GPT-4o、Sonnet-3.5相繼敗于「視力」測試
        關(guān)鍵字:模型,準(zhǔn)確率,多少錢,解讀,測試
        文章來源:機(jī)器之心
        內(nèi)容字?jǐn)?shù):0字

        內(nèi)容摘要:


        機(jī)器之心報道
        機(jī)器之心編輯部四大 VLM,竟都在盲人摸象?
        讓現(xiàn)在最火的 SOTA 模型們(GPT-4o,Gemini-1.5,Sonnet-3,Sonnet-3.5)數(shù)一數(shù)兩條線有幾個交點,他們表現(xiàn)會比人類好嗎?
        答案很可能是否定的。
        自 GPT-4V 推出以來,視覺語言模型 (VLMs) 讓大模型的智能程度朝著我們想象中的人工智能水平躍升了一大步。
        VLMs 既能看懂畫面,又能用語言來描述看到的東西,并基于這些理解來執(zhí)行復(fù)雜的任務(wù)。比如,給 VLM 模型發(fā)去一張餐桌的圖片,再發(fā)一張菜單的圖片,它就能從兩張圖中分別提取啤酒瓶的數(shù)量和菜單上的單價,算出這頓飯買啤酒花了多少錢。
        VLMs 的進(jìn)步如此之快,以至于讓模型找出這張圖中有沒有一些不合常理的「抽象元素」,例如,讓模型鑒定圖中有沒有一個人正在飛馳的出租車上熨衣服,成為了一種通行的測評方式。然而,目前的基準(zhǔn)測試集并不能很好地評估 VLMs 的視覺能力。以 MMMU 為例,其中有 42.9% 的問題不需要看圖,就能解決,也就是說,許多答案可以僅通過文本問題和選項推斷出來。其次,現(xiàn)在 VLM 展示出的能力,很大程度上是「背記」大規(guī)模互聯(lián)網(wǎng)


        原文鏈接:這些VLM竟都是盲人?GPT-4o、Sonnet-3.5相繼敗于「視力」測試

        聯(lián)系作者

        文章來源:機(jī)器之心
        作者微信:almosthuman2014
        作者簡介:專業(yè)的人工智能媒體和產(chǎn)業(yè)服務(wù)平臺

        閱讀原文
        ? 版權(quán)聲明
        Trae官網(wǎng)

        相關(guān)文章

        Trae官網(wǎng)

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 色欲色欲天天天www亚洲伊| 国产免费牲交视频免费播放| 亚洲AV无码一区二区三区鸳鸯影院| 日韩黄色免费观看| 在线播放免费人成视频网站| 亚洲高清视频在线播放| 免费a级毛片永久免费| 久久99精品免费视频| 亚洲精品色播一区二区| 亚洲成A人片777777| 免费高清在线爱做视频| 亚洲精品中文字幕无乱码麻豆| 亚洲成?v人片天堂网无码| 99爱视频99爱在线观看免费| 美女羞羞喷液视频免费| 337p日本欧洲亚洲大胆色噜噜| 日韩精品成人亚洲专区| 一区二区三区AV高清免费波多| 亚洲欧洲日产国产综合网| 99热这里只有精品6免费| 亚洲AV电影天堂男人的天堂| 综合自拍亚洲综合图不卡区| 亚洲av无码国产精品色在线看不卡| 69式互添免费视频| A毛片毛片看免费| 久久亚洲精品高潮综合色a片| 亚洲精选在线观看| 亚洲精品久久久www| 大香人蕉免费视频75| 亚洲欧洲免费视频| 高清免费久久午夜精品| 亚洲欧美日韩一区二区三区 | 久久性生大片免费观看性| 久久精品国产亚洲av麻豆图片| 亚洲成A人片在线观看无码不卡| 国产一区二区三区在线免费观看| 男男AV纯肉无码免费播放无码| 中文字幕视频免费| a毛片在线看片免费| jizz免费在线影视观看网站| 国产精品亚洲综合网站|