<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        多模態LLM視覺推理能力堪憂,浙大領銜用GPT-4合成數據構建多模態基準

        AIGC動態9個月前發布 新智元
        524 0 0

        多模態LLM視覺推理能力堪憂,浙大領銜用GPT-4合成數據構建多模態基準

        AIGC動態歡迎閱讀

        原標題:多模態LLM視覺推理能力堪憂,浙大領銜用GPT-4合成數據構建多模態基準
        關鍵字:模型,數據,圖像,視覺,代碼
        文章來源:新智元
        內容字數:0字

        內容摘要:


        新智元報道編輯:喬楊
        【新智元導讀】LLM的數學推理能力缺陷得到了很多研究的關注,但最近浙大、中科院等機構的學者們提出,先進模型在視覺推理方面同樣不足。為此他們提出了一種多模態的視覺推理基準,并設計了一種新穎的數據合成方法。無論是語言模型還是視覺模型,似乎都很難完成更抽象層次上的理解和推理任務。
        語言模型已經可以寫詩寫小說了,但是依舊算不對9.11和9.9比大小的問題。
        同樣的問題也出現在視覺模型中,它們能完美理解自然景色或人物照片,卻無法處理各種圖表任務,甚至看表讀時間都是難題。
        如果要將AI系統用在更多專業領域,這些能力缺陷就顯得極為突出。
        最近,浙江大學、中科院軟件研究所、上海科技大學等機構就聯合提出了一種新的多模態基準,專門衡量模型對抽象圖像的理解能力和視覺推理能力。
        論文地址:https://arxiv.org/pdf/2407.07053
        數據集共包含11,193個帶有相關問題的抽象圖像,涵蓋了儀表板、路線圖、圖表、表格、流程圖、關系圖、視覺謎題和2D平面圖等8大類別,此外還有額外的62,476條數據用于微調模型。
        經過測試,人類在該基準上可以達到至少82.1%的準確率,


        原文鏈接:多模態LLM視覺推理能力堪憂,浙大領銜用GPT-4合成數據構建多模態基準

        聯系作者

        文章來源:新智元
        作者微信:
        作者簡介:

        閱讀原文
        ? 版權聲明
        Trae官網

        相關文章

        Trae官網

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 亚洲黄网在线观看| 亚洲免费精彩视频在线观看| 国产亚洲精品成人AA片| 亚洲精品在线免费看| 亚洲视频在线观看免费视频| 亚洲视频在线免费播放| 亚洲第一成年人网站| 免费下载成人电影| 亚洲高清有码中文字| 在线观看免费国产视频| 特级aa**毛片免费观看| 国产亚洲精品a在线观看| 久久成人永久免费播放| 久久精品亚洲视频| 亚洲精品国产免费| 亚洲性无码AV中文字幕| 国产乱色精品成人免费视频| 免费无码午夜福利片69| 亚洲国产精品无码成人片久久| 亚洲黄色三级视频| 日韩电影免费观看| 亚洲黄色在线观看网站| 最近高清中文字幕无吗免费看| 亚洲一级毛片中文字幕| 特级淫片国产免费高清视频| 国产精品亚洲综合一区在线观看| 免费又黄又爽的视频| 国产乱妇高清无乱码免费| 亚洲AV成人片色在线观看高潮| 免费v片在线观看视频网站| 亚洲人成人网毛片在线播放| xvideos亚洲永久网址| 久久国产精品免费| 亚洲理论在线观看| 国产免费牲交视频| 日韩电影免费在线观看中文字幕| 亚洲youjizz| 亚洲精品WWW久久久久久| 中文字幕免费视频一| 亚洲av中文无码字幕色不卡| 亚洲国产精品无码久久一线|