<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        GPT-4o差點沒及格!首個多任務長視頻評測基準,它有億點難

        AIGC動態1年前 (2024)發布 量子位
        483 0 0

        GPT-4o差點沒及格!首個多任務長視頻評測基準,它有億點難

        AIGC動態歡迎閱讀

        原標題:GPT-4o差點沒及格!首個多任務視頻評測基準,它有億點難
        關鍵字:視頻,任務,細節,問題,模型
        文章來源:量子位
        內容字數:0字

        內容摘要:


        MLVU團隊 投稿量子位 | 公眾號 QbitAI難度大升級的多任務長視頻理解評測基準MLVU來了!
        由智源聯合北郵、北大和浙大等多所高校推出。
        究竟有多難呢?最終排名第一的GPT-4o單選正確率還不足65%。
        而且研究發現,大部分模型的性能都會隨著視頻時長增加顯著下降。
        研究進一步證明,提升上下文窗口,提升圖像理解能力,以及使用更強大的LLM Backbone對長視頻理解的性能具有顯著的提升作用。
        目前相關論文及數據集已公開,具體細節下面一起看看吧~
        MLVU的構建過程當前流行的Video Benchmark主要針對短視頻設計,大部分視頻的長度都在1分鐘以內。
        且現有評測基準往往專注在特定領域的視頻(例如電影、第一視角)和特定的視頻評測任務(例如Captioning,Temporal Perception,Action Understanding)。
        此外,現有部分長視頻理解評測任務往往只和局部幀有關,或者針對經典電影進行問答,這導致MLLMs可以直接憑借text prompt正確回答而無需對視頻進行分析。
        針對以上不足,新基準MLVU從以下3個層面進行構建:
        時長和來源更豐富MLV


        原文鏈接:GPT-4o差點沒及格!首個多任務長視頻評測基準,它有億點難

        聯系作者

        文章來源:量子位
        作者微信:QbitAI
        作者簡介:追蹤人工智能新趨勢,關注科技行業新突破

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 久久精品国产亚洲AV久| 亚洲婷婷国产精品电影人久久| 国产亚洲精品岁国产微拍精品| 国产精品亚洲综合网站| 全免费a级毛片免费看不卡| 亚洲影视自拍揄拍愉拍| 最近2019中文字幕免费看最新| 国产成人精品日本亚洲专| 69成人免费视频无码专区| 国产成人亚洲合集青青草原精品| 在线观看免费人成视频| 亚洲熟妇无码一区二区三区导航| 巨胸喷奶水视频www网免费| 亚洲成av人在线观看网站| 亚洲 自拍 另类小说综合图区| 免费人成再在线观看网站 | a毛片在线免费观看| 亚洲精品无码鲁网中文电影| 免费一级不卡毛片| 亚洲美女激情视频| 好男人看视频免费2019中文| 美女视频黄a视频全免费网站色 | 亚洲图片中文字幕| 男女交性永久免费视频播放 | 亚洲日韩精品无码专区| 免费a级毛片18以上观看精品| 一级做a免费视频观看网站| 亚洲人成网站影音先锋播放| 91av免费观看| 亚洲AV无码专区在线电影成人| 国产亚洲综合一区二区三区| 亚洲国产黄在线观看| 国产午夜不卡AV免费| 亚洲ts人妖网站| 亚洲熟伦熟女新五十路熟妇| 四虎国产精品永久免费网址| 亚洲无码视频在线| 猫咪免费人成网站在线观看| 精品国产亚洲AV麻豆| 亚洲avav天堂av在线不卡| 永久免费AV无码网站在线观看|