<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        MMMU華人團隊更新Pro版!多模態基準升至史詩級難度:過濾純文本問題、引入純視覺問答

        AIGC動態8個月前發布 新智元
        386 0 0

        MMMU華人團隊更新Pro版!多模態基準升至史詩級難度:過濾純文本問題、引入純視覺問答

        AIGC動態歡迎閱讀

        原標題:MMMU華人團隊更新Pro版!多模態基準升至史詩級難度:過濾純文本問題、引入純視覺問答
        關鍵字:模型,問題,視覺,性能,基準
        文章來源:新智元
        內容字數:0字

        內容摘要:


        新智元報道編輯:LRS
        【新智元導讀】MMMU-Pro通過三步構建過程(篩選問題、增加候選選項、引入純視覺輸入設置)更嚴格地評估模型的多模態理解能力;模型在新基準上的性能下降明顯,表明MMMU-Pro能有效避免模型依賴捷徑和猜測策略的情況。多模態大型語言模型(MLLMs)在各個排行榜上展現的性能不斷提升,例如GPT-4o在大學水平上的多學科多模態理解和推理(MMMU)基準測試中取得了69.1%的準確率。
        不過,基準測試結果是否真的能反映模型對多樣化主題的深入理解,仍然有爭議,或者說模型是否只是利用了統計模式,而非依靠理解和推理的情況下就能得出正確答案?
        為了解決這一問題并推動多模態AI評估的邊界,MMMU團隊對MMMU基準在健壯性和問題難度上進行提升,新基準MMMU-Pro能夠更準確、更嚴格地評估模型在廣泛的學科領域內真正的多模態理解和推理能力。論文鏈接:https://arxiv.org/abs/2409.02813
        MMMU-Pro的構建過程包括三步:
        1. 過濾掉純文本模型可回答的問題;
        2. 由人類專家將候選選項增加到 10 個,以減少模型蒙對答案的概率;
        3. 引入純視覺輸


        原文鏈接:MMMU華人團隊更新Pro版!多模態基準升至史詩級難度:過濾純文本問題、引入純視覺問答

        聯系作者

        文章來源:新智元
        作者微信:
        作者簡介:

        閱讀原文
        ? 版權聲明
        Trae官網

        相關文章

        Trae官網

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 你好老叔电影观看免费| 亚洲第一成年免费网站| 久久九九免费高清视频 | 99久久综合精品免费| 亚洲一区二区三区在线视频| 一级午夜a毛片免费视频| 亚洲av无码国产精品色在线看不卡 | 一级特级aaaa毛片免费观看| 亚洲国产日韩在线观频| sihu国产精品永久免费| 91麻豆国产自产在线观看亚洲| 国产精品免费久久久久影院| 国产精品亚洲一区二区三区在线 | 国产免费观看青青草原网站| 日韩欧美亚洲国产精品字幕久久久| 国产成人啪精品视频免费网| 国产一区二区三区亚洲综合| 亚洲综合国产精品第一页 | 18女人水真多免费高清毛片| 亚洲欧洲日韩综合| 夫妻免费无码V看片| 日本一区二区三区免费高清在线| 国产成人亚洲精品影院| 免费精品99久久国产综合精品| 亚洲精品影院久久久久久| 蜜桃视频在线观看免费网址入口| 亚洲aⅴ无码专区在线观看| 亚洲精品高清一二区久久| 国产精品偷伦视频观看免费| 亚洲日本国产乱码va在线观看| 午夜免费福利在线| 久久精品免费大片国产大片| 中文字幕亚洲色图| 日韩成人免费aa在线看| 国产性生大片免费观看性| 久久丫精品国产亚洲av不卡| 精品少妇人妻AV免费久久洗澡| 中文字幕免费播放| 亚洲国产最大av| 最新国产AV无码专区亚洲| 波多野结衣在线免费视频 |