<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        這些VLM竟都是盲人?GPT-4o、Sonnet-3.5相繼敗于「視力」測試

        AIGC動態1年前 (2024)發布 機器之心
        466 0 0

        這些VLM竟都是盲人?GPT-4o、Sonnet-3.5相繼敗于「視力」測試

        AIGC動態歡迎閱讀

        原標題:這些VLM竟都是盲人?GPT-4o、Sonnet-3.5相繼敗于「視力」測試
        關鍵字:模型,準確率,多少錢,解讀,測試
        文章來源:機器之心
        內容字數:0字

        內容摘要:


        機器之心報道
        機器之心編輯部四大 VLM,竟都在盲人摸象?
        讓現在最火的 SOTA 模型們(GPT-4o,Gemini-1.5,Sonnet-3,Sonnet-3.5)數一數兩條線有幾個交點,他們表現會比人類好嗎?
        答案很可能是否定的。
        自 GPT-4V 推出以來,視覺語言模型 (VLMs) 讓大模型的智能程度朝著我們想象中的人工智能水平躍升了一大步。
        VLMs 既能看懂畫面,又能用語言來描述看到的東西,并基于這些理解來執行復雜的任務。比如,給 VLM 模型發去一張餐桌的圖片,再發一張菜單的圖片,它就能從兩張圖中分別提取啤酒瓶的數量和菜單上的單價,算出這頓飯買啤酒花了多少錢。
        VLMs 的進步如此之快,以至于讓模型找出這張圖中有沒有一些不合常理的「抽象元素」,例如,讓模型鑒定圖中有沒有一個人正在飛馳的出租車上熨衣服,成為了一種通行的測評方式。然而,目前的基準測試集并不能很好地評估 VLMs 的視覺能力。以 MMMU 為例,其中有 42.9% 的問題不需要看圖,就能解決,也就是說,許多答案可以僅通過文本問題和選項推斷出來。其次,現在 VLM 展示出的能力,很大程度上是「背記」大規模互聯網


        原文鏈接:這些VLM竟都是盲人?GPT-4o、Sonnet-3.5相繼敗于「視力」測試

        聯系作者

        文章來源:機器之心
        作者微信:almosthuman2014
        作者簡介:專業的人工智能媒體和產業服務平臺

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 视频一区在线免费观看| 中文字幕视频在线免费观看| 亚洲成av人在线观看网站| 美女又黄又免费的视频| 免费被黄网站在观看| 亚洲日韩国产成网在线观看| 亚洲2022国产成人精品无码区 | 免费观看成人毛片a片2008| 免费永久看黄在线观看app| 亚洲精品**中文毛片| 一本到卡二卡三卡免费高| 91禁漫免费进入| 亚洲精品网站在线观看不卡无广告| 亚洲无限乱码一二三四区| a级成人免费毛片完整版| 国产亚洲一区二区三区在线| 久久精品国产亚洲av品善| 足恋玩丝袜脚视频免费网站| 亚洲精品一级无码鲁丝片| xxxx日本在线播放免费不卡| 国产成A人亚洲精V品无码 | 亚洲精品无码少妇30P| 国产成人久久AV免费| 午夜亚洲av永久无码精品| 国产精品亚洲专区在线观看| 国产免费爽爽视频在线观看| 亚洲午夜爱爱香蕉片| 九九精品成人免费国产片| 亚洲成在人线中文字幕| 国产又粗又长又硬免费视频| 亚洲国产成人久久精品大牛影视| 国产在线19禁免费观看国产| 成人免费无码H在线观看不卡| 免费国产高清视频| 九九精品国产亚洲AV日韩| 亚洲精品无码久久久久AV麻豆| 国产精品免费看久久久| 亚洲人成无码网站在线观看| 伊人久久亚洲综合| 国产免费一区二区视频| 亚洲综合激情五月色一区|