<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        統一SAM2和LLaVA!字節豆包提出Dense Video多模態大模型Sa2VA

        AIGC動態3個月前發布 機器之心
        386 0 0

        第一個結合SAM-2和LLaVA-like的視頻多模態大模型

        統一SAM2和LLaVA!字節豆包提出Dense Video多模態大模型Sa2VA

        原標題:統一SAM2和LLaVA!字節豆包提出Dense Video多模態大模型Sa2VA
        文章來源:機器之心
        內容字數:8977字

        Sa2VA:首個結合SAM-2和LLaVA-like的視頻多模態大模型

        本文介紹了來自字節跳動、北京大學等機構研究者提出的Sa2VA模型,這是市面上第一個結合SAM-2和LLaVA-like架構的視頻多模態大模型。Sa2VA整合了SAM-2的感知能力和LLaVA的推理能力,實現了時空細粒度的視頻理解,并在多個視頻和圖像理解任務上取得了領先效果。

        1. 研究背景和動機

        近年來,多模態大語言模型取得了顯著進展,能夠支持圖像對話、視頻對話等多種任務。然而,現有模型在細粒度圖像和視頻理解方面存在不足:感知模型缺乏自然語言推理能力,而多模態大語言模型缺乏感知能力,特別是視頻分割能力。Sa2VA旨在結合兩者的優勢,構建一個統一的模型,支持圖像、視頻細粒度感知以及對話、分析等任務。

        2. 模型設計與實現

        Sa2VA的核心設計理念是將所有輸入(文本、視覺提示、圖像、視頻)統一編碼為令牌,進行聯合訓練。模型主要包含兩部分:多模態大語言模型和SAM-2模型。多模態大語言模型負責處理文本和視覺信息,SAM-2模型負責分割任務。兩者通過“[SEG]”令牌連接,實現信息的交互和傳遞。對于視頻指代分割,Sa2VA利用關鍵幀和SAM-2的記憶編碼器實現高效的跟蹤和分割。

        3. 訓練方法

        Sa2VA采用統一的指令微調格式,整合了圖像和視頻Referring Expression Segmentation (RES)、Visual Question Answering (VQA)、Grounded Conversation Generation (GCG)等多種任務,并使用不同的損失函數進行聯合訓練。得益于預訓練的多模態大語言模型,Sa2VA無需額外的預訓練階段。

        4. Ref-SAM-v Benchmark

        研究者還提出了一個新的Benchmark,Ref-SAM-2v,以及對應的訓練數據集,該數據集相比于之前的Ref-VOS數據集更具挑戰性。

        5. 數值結果與可視化

        Sa2VA在13個公開數據集上的5個不同任務中取得了領先的結果,并在提出的Ref-SAM-v benchmark上也大幅領先現有工作??梢暬Y果展示了Sa2VA在圖像和視頻字幕生成、對話、指代對象分割、GCG、視覺指代物體描述等任務上的出色性能,并能擴展到開放場景。

        6. 總結

        Sa2VA 通過巧妙地結合SAM-2和LLaVA-like模型的優勢,并采用創新的訓練方法,在視頻多模態理解領域取得了突破性進展。其在細粒度視頻理解和多種下游任務上的優異表現,為未來多模態大模型的發展提供了新的方向。


        聯系作者

        文章來源:機器之心
        作者微信:
        作者簡介:專業的人工智能媒體和產業服務平臺

        閱讀原文
        ? 版權聲明
        Trae官網

        相關文章

        Trae官網

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 久久免费香蕉视频| 国产免费丝袜调教视频| 国产亚洲高清不卡在线观看| 亚洲午夜免费视频| 亚洲一线产区二线产区区| 亚洲欧洲一区二区三区| 99久久免费看国产精品| 亚洲av成人片在线观看| 亚洲AV无码乱码国产麻豆| 最近中文字幕无吗免费高清| 国产免费内射又粗又爽密桃视频 | 久久亚洲精品国产精品婷婷| 亚洲一区二区三区国产精品| 免费观看激色视频网站bd| 噜噜噜亚洲色成人网站| 久久精品国产亚洲AV香蕉| 免费女人18毛片a级毛片视频| 日韩精品免费在线视频| 国产成人亚洲精品播放器下载| 亚洲国产成人一区二区精品区| 夜夜嘿视频免费看| 少妇无码一区二区三区免费| 国产精品亚洲综合网站| 亚洲视频免费观看| 亚洲日韩在线观看| 午夜dj免费在线观看| 免费人成在线观看网站品爱网| 人人爽人人爽人人片av免费| 亚洲色丰满少妇高潮18p| 99久久亚洲精品无码毛片 | 亚洲午夜福利在线视频| 91亚洲一区二区在线观看不卡| 亚洲精品久久久www| 最近最好的中文字幕2019免费| 无码国产精品一区二区免费vr| 男性gay黄免费网站| 亚洲人成色99999在线观看| 亚洲美女自拍视频| 亚洲国产天堂在线观看| 精品亚洲一区二区三区在线观看| 亚洲一区二区三区高清在线观看 |