<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        統一SAM2和LLaVA!字節豆包提出Dense Video多模態大模型Sa2VA

        AIGC動態7個月前發布 機器之心
        416 0 0

        第一個結合SAM-2和LLaVA-like的視頻多模態大模型

        統一SAM2和LLaVA!字節豆包提出Dense Video多模態大模型Sa2VA

        原標題:統一SAM2和LLaVA!字節豆包提出Dense Video多模態大模型Sa2VA
        文章來源:機器之心
        內容字數:8977字

        Sa2VA:首個結合SAM-2和LLaVA-like的視頻多模態大模型

        本文介紹了來自字節跳動、北京大學等機構研究者提出的Sa2VA模型,這是市面上第一個結合SAM-2和LLaVA-like架構的視頻多模態大模型。Sa2VA整合了SAM-2的感知能力和LLaVA的推理能力,實現了時空細粒度的視頻理解,并在多個視頻和圖像理解任務上取得了領先效果。

        1. 研究背景和動機

        近年來,多模態大語言模型取得了顯著進展,能夠支持圖像對話、視頻對話等多種任務。然而,現有模型在細粒度圖像和視頻理解方面存在不足:感知模型缺乏自然語言推理能力,而多模態大語言模型缺乏感知能力,特別是視頻分割能力。Sa2VA旨在結合兩者的優勢,構建一個統一的模型,支持圖像、視頻細粒度感知以及對話、分析等任務。

        2. 模型設計與實現

        Sa2VA的核心設計理念是將所有輸入(文本、視覺提示、圖像、視頻)統一編碼為令牌,進行聯合訓練。模型主要包含兩部分:多模態大語言模型和SAM-2模型。多模態大語言模型負責處理文本和視覺信息,SAM-2模型負責分割任務。兩者通過“[SEG]”令牌連接,實現信息的交互和傳遞。對于視頻指代分割,Sa2VA利用關鍵幀和SAM-2的記憶編碼器實現高效的跟蹤和分割。

        3. 訓練方法

        Sa2VA采用統一的指令微調格式,整合了圖像和視頻Referring Expression Segmentation (RES)、Visual Question Answering (VQA)、Grounded Conversation Generation (GCG)等多種任務,并使用不同的損失函數進行聯合訓練。得益于預訓練的多模態大語言模型,Sa2VA無需額外的預訓練階段。

        4. Ref-SAM-v Benchmark

        研究者還提出了一個新的Benchmark,Ref-SAM-2v,以及對應的訓練數據集,該數據集相比于之前的Ref-VOS數據集更具挑戰性。

        5. 數值結果與可視化

        Sa2VA在13個公開數據集上的5個不同任務中取得了領先的結果,并在提出的Ref-SAM-v benchmark上也大幅領先現有工作??梢暬Y果展示了Sa2VA在圖像和視頻字幕生成、對話、指代對象分割、GCG、視覺指代物體描述等任務上的出色性能,并能擴展到開放場景。

        6. 總結

        Sa2VA 通過巧妙地結合SAM-2和LLaVA-like模型的優勢,并采用創新的訓練方法,在視頻多模態理解領域取得了突破性進展。其在細粒度視頻理解和多種下游任務上的優異表現,為未來多模態大模型的發展提供了新的方向。


        聯系作者

        文章來源:機器之心
        作者微信:
        作者簡介:專業的人工智能媒體和產業服務平臺

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 88xx成人永久免费观看| 永久免费观看黄网站| 久久精品人成免费| 亚洲av无码乱码国产精品| 你是我的城池营垒免费看| 亚洲成A人片在线观看无码不卡| 久久毛片免费看一区二区三区| 亚洲人妻av伦理| 两性色午夜视频免费网| 亚洲va无码专区国产乱码| 国产精品视频白浆免费视频| 亚洲首页在线观看| 亚欧免费视频一区二区三区| 亚洲三级在线观看| 国产精品冒白浆免费视频| 性生大片视频免费观看一级 | 在线观看黄片免费入口不卡| 亚洲中文字幕无码爆乳av中文 | 69av免费视频| 亚洲娇小性xxxx色| 日本一线a视频免费观看| 又硬又粗又长又爽免费看| 中文字幕精品亚洲无线码二区| 精品免费视在线观看| 亚洲麻豆精品果冻传媒| 在线免费观看a级片| 九九热久久免费视频| 亚洲av日韩av不卡在线观看| 在线观看免费人成视频| 免费一级毛片在线播放放视频| 亚洲成av人在线视| 成年轻人网站色免费看| 国产一级黄片儿免费看| 亚洲中文无码线在线观看| 日本特黄特色aa大片免费| 久久九九全国免费| 中国亚洲呦女专区| 亚洲精品中文字幕乱码三区 | 黄页视频在线观看免费| 久久亚洲国产精品五月天| 永久免费视频v片www|