<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        考考大模型視頻理解能力,中科院人大百川提出新基準(zhǔn)合成框架

        AIGC動態(tài)11個月前發(fā)布 量子位
        344 0 0

        考考大模型視頻理解能力,中科院人大百川提出新基準(zhǔn)合成框架

        AIGC動態(tài)歡迎閱讀

        原標(biāo)題:考考大模型視頻理解能力,中科院人大百川提出新基準(zhǔn)合成框架
        關(guān)鍵字:模型,視頻,任務(wù),能力,基準(zhǔn)
        文章來源:量子位
        內(nèi)容字?jǐn)?shù):0字

        內(nèi)容摘要:


        VideoNIAH團隊 投稿量子位 | 公眾號 QbitAI測試Gemini1.5 Pro、GPT-4o等多模態(tài)大模型的新基準(zhǔn)來了,針對視頻理解能力的那種。
        直接在視頻內(nèi)容中插入多個無關(guān)的圖像或文本“針”,嚴(yán)格評估模型對時間理解的能力。
        來看下面的栗子。
        比如插入密碼詞“Alice”,讓模型找到這個密碼詞;插入蘋果圖片,讓模型解答這個水果是什么;又或者插入多個“針”,詢問模型插入針的順序是什么。
        這就是來自中科院、人大、百川的研究團隊聯(lián)合提出的利用合成視頻構(gòu)建視頻理解測試基準(zhǔn)的方法。
        該方法名為VideoNIAH,可以解耦視頻內(nèi)容與其對應(yīng)的查詢-響應(yīng)對,通過插入無關(guān)的圖像或文本“針”來生成測試數(shù)據(jù),既保證了視頻來源的多樣性和查詢響應(yīng)的多樣性,還通過插入多個針來嚴(yán)格評估模型對時間理解的能力。
        此外,使用與現(xiàn)實視頻內(nèi)容相對應(yīng)的查詢-響應(yīng)對可能存在數(shù)據(jù)泄露風(fēng)險,影響基準(zhǔn)測試的公平性,使用合成視頻生成方法可以有效避免這一問題。
        研究團隊利用VideoNIAH方法制作了一個能夠有效評估視頻模型的細(xì)粒度理解能力和時空建模能力,同時支持長上下文評估的合成視頻理解基準(zhǔn)VNBench,包含1350個樣本


        原文鏈接:考考大模型視頻理解能力,中科院人大百川提出新基準(zhǔn)合成框架

        聯(lián)系作者

        文章來源:量子位
        作者微信:QbitAI
        作者簡介:追蹤人工智能新趨勢,關(guān)注科技行業(yè)新突破

        閱讀原文
        ? 版權(quán)聲明
        Trae官網(wǎng)

        相關(guān)文章

        Trae官網(wǎng)

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 四只虎免费永久观看| 337p欧洲亚洲大胆艺术| 中文字幕无码免费久久| 亚洲一卡2卡4卡5卡6卡残暴在线| 国产高清免费在线| a视频在线免费观看| 无码 免费 国产在线观看91| 91精品免费久久久久久久久| mm1313亚洲国产精品无码试看| 中文亚洲AV片不卡在线观看| 两性刺激生活片免费视频| jizz免费观看视频| 国产亚洲精品bv在线观看| 亚洲人成网亚洲欧洲无码久久| 久久不见久久见中文字幕免费| 男女一边桶一边摸一边脱视频免费 | 亚洲黄片手机免费观看| 亚洲国产精品成人精品软件| 亚洲AV成人精品日韩一区18p| 在线观看亚洲AV日韩AV| 亚洲日产无码中文字幕| 日韩精品免费一区二区三区| 99在线视频免费| 中文字幕永久免费| 国产成人精品久久亚洲高清不卡| 亚洲成人中文字幕| 国产成人亚洲精品91专区手机| 成人毛片免费观看视频| 97视频免费观看2区| WWW国产成人免费观看视频| 亚洲国产成人综合精品| 亚洲成人免费网址| 久久亚洲精品成人| 国产成人麻豆亚洲综合无码精品| 国产精品无码一二区免费| av无码免费一区二区三区| 人人玩人人添人人澡免费| 国产99精品一区二区三区免费| 日韩亚洲综合精品国产| 亚洲日韩国产二区无码| 亚洲一区精品视频在线|