<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        北大視頻大模型新SOTA,搞笑抖音視頻AI秒懂笑點|開源

        AIGC動態(tài)1年前 (2023)發(fā)布 量子位
        546 0 0

        北大視頻大模型新SOTA,搞笑抖音視頻AI秒懂笑點|開源

        AIGC動態(tài)歡迎閱讀

        原標(biāo)題:北大視頻大模型新SOTA,搞笑抖音視頻AI秒懂笑點|開源

        關(guān)鍵字:報告,視覺,視頻,編碼器,表示

        文章來源:量子位

        內(nèi)容字?jǐn)?shù):3357字

        內(nèi)容摘要:夢晨 發(fā)自 凹非寺量子位 | 公眾號 QbitAIAI能理解搞笑視頻笑點在哪里了。AI回答:這個視頻之所以搞笑,在于一個小寶寶正坐在床上努力讀書,但他顯然還不會真正讀書。他只是不停地指著書頁上的各處,而攝影者則在背后笑他。小寶寶的這種嘗試很有趣,因為他在嘗試閱讀一本對他而言過大的書,也看不懂里面的文字。北大等團隊開源視覺語言大模型Video-LLaVA,將圖像和視頻表示對齊到統(tǒng)一的視覺特征空間,在13個圖片和視頻基準(zhǔn)上達(dá)到先進的性能。值得注意的是,Video-LLaVA在訓(xùn)練過程中沒有使用成對的視頻和圖片數(shù)據(jù),但在訓(xùn)練后,LLM令人驚訝地展現(xiàn)出同時理解圖片和視頻的能力。如下圖所示,Video-LLaVA成功地識別出女神像的圖片是近景且細(xì)膩的,而視頻描述了女神像的多個角度,表明它們來自同一個地方。在投影之前對齊圖像和視頻表示這項工作具體貢獻如下:Video-LLaVA解決了在視覺-語…

        原文鏈接:點此閱讀原文:北大視頻大模型新SOTA,搞笑抖音視頻AI秒懂笑點|開源

        聯(lián)系作者

        文章來源:量子位

        作者微信:QbitAI

        作者簡介:追蹤人工智能新趨勢,關(guān)注科技行業(yè)新突破

        閱讀原文
        ? 版權(quán)聲明
        Trae官網(wǎng)

        相關(guān)文章

        Trae官網(wǎng)

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 免费精品一区二区三区第35| 午夜电影免费观看| 亚洲AV伊人久久青青草原| 三年片在线观看免费观看高清电影 | 色欲色香天天天综合网站免费| 国产成人高清精品免费软件| 亚洲综合久久久久久中文字幕| 国产福利电影一区二区三区,免费久久久久久久精 | 免费高清av一区二区三区| 亚洲国产二区三区久久| 亚洲熟妇色自偷自拍另类| yellow视频免费看| 国产美女a做受大片免费| 亚洲白嫩在线观看| 成全高清在线观看免费| 亚洲AV无码一区二三区| 亚洲综合av一区二区三区不卡| 中文字幕在线免费观看| 天天干在线免费视频| 亚洲视频一区在线观看| 光棍天堂免费手机观看在线观看| 全部免费a级毛片| 亚洲日韩精品国产一区二区三区| 精品免费人成视频app| 亚洲电影中文字幕| 岛国岛国免费V片在线观看| 四虎永久成人免费| 亚洲av永久中文无码精品| 91嫩草免费国产永久入口| 久久亚洲精品成人777大小说| 2022免费国产精品福利在线 | 亚洲成av人片在www鸭子| 免费av欧美国产在钱| 亚洲日本香蕉视频| 真实国产乱子伦精品免费| 久久精品亚洲综合| 国产在线精品免费aaa片| 亚洲精品无码专区久久久| 国产在线观看无码免费视频| 毛茸茸bbw亚洲人| 一级毛片无遮挡免费全部|