<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        MMMU華人團隊更新Pro版!多模態基準升至史詩級難度:過濾純文本問題、引入純視覺問答

        AIGC動態8個月前發布 新智元
        386 0 0

        MMMU華人團隊更新Pro版!多模態基準升至史詩級難度:過濾純文本問題、引入純視覺問答

        AIGC動態歡迎閱讀

        原標題:MMMU華人團隊更新Pro版!多模態基準升至史詩級難度:過濾純文本問題、引入純視覺問答
        關鍵字:模型,問題,視覺,性能,基準
        文章來源:新智元
        內容字數:0字

        內容摘要:


        新智元報道編輯:LRS
        【新智元導讀】MMMU-Pro通過三步構建過程(篩選問題、增加候選選項、引入純視覺輸入設置)更嚴格地評估模型的多模態理解能力;模型在新基準上的性能下降明顯,表明MMMU-Pro能有效避免模型依賴捷徑和猜測策略的情況。多模態大型語言模型(MLLMs)在各個排行榜上展現的性能不斷提升,例如GPT-4o在大學水平上的多學科多模態理解和推理(MMMU)基準測試中取得了69.1%的準確率。
        不過,基準測試結果是否真的能反映模型對多樣化主題的深入理解,仍然有爭議,或者說模型是否只是利用了統計模式,而非依靠理解和推理的情況下就能得出正確答案?
        為了解決這一問題并推動多模態AI評估的邊界,MMMU團隊對MMMU基準在健壯性和問題難度上進行提升,新基準MMMU-Pro能夠更準確、更嚴格地評估模型在廣泛的學科領域內真正的多模態理解和推理能力。論文鏈接:https://arxiv.org/abs/2409.02813
        MMMU-Pro的構建過程包括三步:
        1. 過濾掉純文本模型可回答的問題;
        2. 由人類專家將候選選項增加到 10 個,以減少模型蒙對答案的概率;
        3. 引入純視覺輸


        原文鏈接:MMMU華人團隊更新Pro版!多模態基準升至史詩級難度:過濾純文本問題、引入純視覺問答

        聯系作者

        文章來源:新智元
        作者微信:
        作者簡介:

        閱讀原文
        ? 版權聲明
        Trae官網

        相關文章

        Trae官網

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 91大神亚洲影视在线| 亚洲狠狠爱综合影院婷婷| 亚洲成A人片在线观看WWW| 日韩免费a级毛片无码a∨| 亚洲午夜视频在线观看| 亚洲日日做天天做日日谢| 九九久久国产精品免费热6| 国产免费小视频在线观看| 久久综合亚洲色hezyo| 国产又大又粗又硬又长免费| 久久精品熟女亚洲av麻豆| 国产裸模视频免费区无码| 亚洲AV美女一区二区三区| 在线观看免费播放av片| 亚洲视频在线观看免费| 国内精品免费麻豆网站91麻豆 | 苍井空亚洲精品AA片在线播放 | 亚洲综合在线视频| 免费国产黄网站在线看| 亚洲成A人片在线观看中文| 久久精品国产亚洲av麻豆蜜芽| 一色屋成人免费精品网站| 亚洲色成人网站WWW永久四虎 | 黄网站免费在线观看| 久久国产亚洲电影天堂| 国产在线jyzzjyzz免费麻豆| 最新亚洲卡一卡二卡三新区| 国产区卡一卡二卡三乱码免费| 一区二区三区在线免费观看视频| 国产亚洲精AA在线观看SEE| 国产综合激情在线亚洲第一页| 亚洲人成色7777在线观看不卡| 男人都懂www深夜免费网站| 亚洲成人黄色在线| 国产精品久免费的黄网站| 国产一级a毛一级a看免费视频| 亚洲精品成人网站在线播放| 精品免费tv久久久久久久| 亚洲一区在线视频观看| 亚洲а∨天堂久久精品| 4虎1515hh永久免费|