<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        VLM集體「失明」?視力測試慘敗,GPT-4o、Claude 3.5全都不及格

        AIGC動態1年前 (2024)發布 新智元
        484 0 0

        VLM集體「失明」?視力測試慘敗,GPT-4o、Claude 3.5全都不及格

        AIGC動態歡迎閱讀

        原標題:VLM集體「失明」?視力測試慘敗,GPT-4o、Claude 3.5全都不及格
        關鍵字:模型,任務,視覺,正方形,字母
        文章來源:新智元
        內容字數:0字

        內容摘要:


        新智元報道編輯:編輯部
        【新智元導讀】視覺大語言模型在最基礎的視覺任務上集體「翻車」,即便是簡單的圖形識別都能難倒一片,或許這些最先進的VLM還沒有發展出真正的視覺能力?最新一輪的語言模型,如GPT-4o和Gemini 1.5 Pro,在發布時都被定義為「原生多模態」,能夠理解圖像、音頻、文本等多種形式的輸入。
        這些多模態LLM在相關的介紹、營銷,甚至是學術論文中,都使用了「視覺能力」(visual capability)、「視覺理解」(visual understanding)這樣的表述。
        這似乎是想表達,模型在某種意義上是可以看見并理解事物的,而且這種能力已經能與人類相匹配。
        那么我們開一個腦洞:如果對視覺語言模型進行視力測試,它們會是標準視力5.2或是大近視眼,還是壓根啥也看不見?
        一項新研究表明,大語言模型實際上并沒有像期望的擁有類人的視覺能力。事實是,它們根本就是「盲人」。
        奧本大學和阿爾伯塔大學的研究人員在一系列非常簡單的視覺任務上測試了4個當今最先進的多模態模型,發現結果并不如人意。
        這些任務對人類來說極其簡單,比如兩個形狀是否重疊、圖片中有多少個五邊形,或者單詞中的哪


        原文鏈接:VLM集體「失明」?視力測試慘敗,GPT-4o、Claude 3.5全都不及格

        聯系作者

        文章來源:新智元
        作者微信:AI_era
        作者簡介:智能+中國主平臺,致力于推動中國從互聯網+邁向智能+新紀元。重點關注人工智能、機器人等前沿領域發展,關注人機融合、人工智能和機器人對人類社會與文明進化的影響,領航中國新智能時代。

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 在线观看免费亚洲| 华人在线精品免费观看| 67194成是人免费无码| 亚洲国产高清美女在线观看| 全部免费毛片在线播放| 亚洲国产精品lv| 67194成手机免费观看| 亚洲网址在线观看| 100000免费啪啪18免进| 亚洲av无码片区一区二区三区| 97国产免费全部免费观看| 久久精品亚洲AV久久久无码| 成人最新午夜免费视频| 亚洲精品国产第一综合99久久| 国产视频精品免费| 亚洲免费在线观看| 无码专区—VA亚洲V天堂| 国产精品入口麻豆免费观看| 99999久久久久久亚洲| 在线观看永久免费视频网站| eeuss影院ss奇兵免费com| 久久被窝电影亚洲爽爽爽 | 99热亚洲色精品国产88| 国产男女猛烈无遮挡免费视频网站| 黄网站色视频免费观看45分钟| 一本色道久久综合亚洲精品| 久久国产精品免费观看| 亚洲 欧洲 自拍 另类 校园| 国产成人一区二区三区免费视频| 国产免费区在线观看十分钟| 久久亚洲AV成人无码| 我要看WWW免费看插插视频| 乱人伦中文视频在线观看免费| 亚洲AV无码一区二区二三区软件| 国产福利在线免费| 一级毛片免费不卡| 亚洲乱码一区av春药高潮| 亚洲国产电影av在线网址| 中文字幕免费在线| 又粗又长又爽又长黄免费视频 | 亚洲精品国产啊女成拍色拍|