<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        精確指出特定發生時間!字節&復旦大學多模態大模型解讀視頻太香了

        AIGC動態2年前 (2024)發布 量子位
        348 0 0

        精確指出特定事件發生時間!字節&復旦大學多模態大模型解讀視頻太香了

        AIGC動態歡迎閱讀

        原標題:精確指出特定發生時間!字節&復旦大學多模態大模型解讀視頻太香了
        關鍵字:解讀,字節跳動,數據,模型,視頻
        文章來源:量子位
        內容字數:3511字

        內容摘要:


        豐色 發自 凹非寺量子位 | 公眾號 QbitAI字節&復旦大學多模態理解大模型來了:
        可以精確定位到視頻中特定的發生時間。
        比如在下面這個視頻中:
        狗子轉身看鏡頭時的時間戳是多少?
        什么時候用爪子推開滑板?
        在這里,視頻中的寶寶什么時候推起眼鏡、舒展了一下身體?又是什么時候翻的書?
        對于這樣的問題,這個叫做LEGO的模型全都讀得懂,并毫不猶豫給出正確答案。
        看起來,有了這些研究成果,以后我們看視頻查資料都要方便一大截咯?
        可精確識別局部信息的多模態LLM來了LEGO全稱是一個語言增強的多模態grounding模型。
        它主要解決的是多模態LLM跨多種模態進行細粒度理解的能力,此前業內的成果主要強調全局信息。
        為了實現該目標,作者主要先從數據集下手,打造了一套用于模型訓練的多模式、多粒度問答形式數據集(即將開源)。
        該數據集的構建涉及兩個關鍵流程。
        一是數據集轉換(Dataset Conversion)。
        在這個階段,作者的目的是構建用于模態對齊和細粒度對齊的基礎多模態數據集。
        由于數據集質量相對較低,主要通過轉換公開數據集獲得。
        如下圖上部分所示,他們向GPT-3.5提供任務描述以


        原文鏈接:精確指出特定發生時間!字節&復旦大學多模態大模型解讀視頻太香了

        聯系作者

        文章來源:量子位
        作者微信:QbitAI
        作者簡介:追蹤人工智能新趨勢,關注科技行業新突破

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 宅男666在线永久免费观看| 亚洲欧美黑人猛交群| 免费人成动漫在线播放r18| 国内一级一级毛片a免费| 亚洲不卡中文字幕无码| 一个人看的www在线免费视频| 日本成人免费在线| 日韩精品无码永久免费网站| 亚洲国产精品无码久久九九| 亚洲 日韩 色 图网站| 午夜小视频免费观看| 亚洲乱色伦图片区小说| 国产精品美女自在线观看免费| 色www免费视频| 亚洲精品岛国片在线观看| 国产福利免费视频 | 国产精品久久久亚洲| 免费无码黄网站在线看| 亚洲国产精品婷婷久久| 日本免费人成网ww555在线| 亚洲国产一二三精品无码| 免费无码又爽又刺激高潮视频 | 亚洲一区二区影院| 国产情侣激情在线视频免费看| 2022年亚洲午夜一区二区福利| 国产桃色在线成免费视频| 香蕉97碰碰视频免费| 亚洲成A人片777777| 毛片在线看免费版| 国产精品玖玖美女张开腿让男人桶爽免费看| 丁香五月亚洲综合深深爱| 精品无码人妻一区二区免费蜜桃| 久久精品国产亚洲av麻豆蜜芽| 四虎在线播放免费永久视频| 97人妻精品全国免费视频 | 69成人免费视频| 边摸边脱吃奶边高潮视频免费| 亚洲国产精品一区第二页| 成在人线AV无码免费| 怡红院免费的全部视频| 亚洲一卡2卡3卡4卡5卡6卡|