<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        僅縮小視覺Token位置編碼間隔,輕松讓多模態(tài)大模型理解百萬Token!清華大學,香港大學,上海AI Lab新突破

        AIGC動態(tài)4個月前發(fā)布 機器之心
        590 0 0

        V2PE 的提出將為視覺 – 語言模型的發(fā)展帶來新的機遇。

        僅縮小視覺Token位置編碼間隔,輕松讓多模態(tài)大模型理解百萬Token!清華大學,香港大學,上海AI Lab新突破

        原標題:僅縮小視覺Token位置編碼間隔,輕松讓多模態(tài)大模型理解百萬Token!清華大學,香港大學,上海AI Lab新突破
        文章來源:機器之心
        內容字數:5998字

        清華、港大、上海AI Lab 聯合提出V2PE:解決視覺語言大模型長上下文難題

        本文介紹了清華大學、香港大學和上海AI Lab 聯合提出的一種新的視覺語言大模型位置編碼方法——Variable Vision Position Embedding (V2PE),該方法有效解決了現有視覺語言大模型 (VLMs) 在長上下文場景下表現不佳的問題。

        1. 長上下文問題與V2PE的提出

        隨著語言大模型的成功,VLMs發(fā)展迅速,但在處理長上下文(如長視頻、高分辨率圖像或長篇圖文文檔)時,其性能顯著下降。 為解決這一問題,研究團隊提出了V2PE。現有VLMs通常沿用文本模型的位置編碼方式處理圖像token,這并非最優(yōu)方案。V2PE通過為視覺token分配可變且較小的位置增量,避免了位置編碼超出模型訓練上下文窗口的限制,從而顯著提升了模型在長上下文任務中的表現。

        2. V2PE的核心思想與優(yōu)勢

        V2PE的核心思想是為視覺token分配可變位置增量。傳統(tǒng)的VLMs位置編碼不區(qū)分文本和圖像token,且使用固定的編碼規(guī)則。而圖像token是二維數據,需要考慮空間位置和多分辨率信息。V2PE通過一個遞歸函數,為文本和視覺token分配不同的位置索引,視覺token的增量小于1,從而有效管理長多模態(tài)序列。這保留了所有視覺token的信息,并允許模型適應任意間隔的位置索引,避免了位置編碼外推帶來的不準確性。

        3. 數據集與實驗結果

        研究團隊構建了兩個增強的長上下文多模態(tài)數據集:Long-VQA和Long-MR,用于評估VLMs的長上下文能力。實驗結果表明,V2PE在32K至1M長度的超長上下文任務中實現了突破性改進,甚至超越了最先進的閉源大模型。在32K以內訓練的模型,在64K長度的測試集上,采用更小的增量可以有效緩解性能下降。在1M長度的測試中,V2PE顯著優(yōu)于未采用V2PE的模型和使用插值方法的模型。

        4. 消融實驗與注意力機制分析

        消融實驗比較了V2PE與其他方法(如token壓縮、固定視覺token位置編碼增量)的性能,證明了V2PE的優(yōu)勢。注意力圖分析顯示,隨著增量的減小,模型能更好地將注意力集中在問題對應的答案附近,證明V2PE能夠有效提升模型對關鍵信息的關注。

        5. 總結

        V2PE為視覺語言模型在長上下文場景下的性能提升提供了一種新的思路。通過為視覺token分配可變的位置增量,V2PE有效解決了位置編碼超出模型訓練上下文窗口的問題,展現了卓越的長上下文處理能力,為VLMs在長上下文多模態(tài)任務中的應用提供了更多可能性。


        聯系作者

        文章來源:機器之心
        作者微信:
        作者簡介:專業(yè)的人工智能媒體和產業(yè)服務平臺

        閱讀原文
        ? 版權聲明
        Trae官網

        相關文章

        Trae官網

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 亚洲一区AV无码少妇电影☆| 日本一区二区三区免费高清| 亚洲国产精品成人一区| 欧美日韩亚洲精品| 免费国产小视频在线观看| 亚洲成在人线在线播放无码| 蜜臀91精品国产免费观看| 亚洲欧美日韩中文二区| 日韩毛片无码永久免费看| 羞羞漫画页面免费入口欢迎你| 波多野结衣中文一区二区免费| 国产成人 亚洲欧洲| 亚洲国产精品成人| 91成人免费福利网站在线| 亚洲AV综合色区无码一区| 国产成人一区二区三区视频免费| 亚洲国产综合精品中文第一区 | 男女超爽视频免费播放| 国产免费久久精品| 国产高潮流白浆喷水免费A片 | 亚洲一区二区三区在线观看精品中文| a毛片全部播放免费视频完整18| 亚洲AV无码久久寂寞少妇| 国产1000部成人免费视频| 亚洲色大成网站www久久九| 全亚洲最新黄色特级网站 | 国产亚洲AV无码AV男人的天堂| 无码日韩精品一区二区免费暖暖 | 亚洲国产无套无码av电影| 中文字幕天天躁日日躁狠狠躁免费| 亚洲制服在线观看| 免费日本黄色网址| 免费毛片在线看不用播放器| 亚洲美女视频网站| 免费国产不卡午夜福在线| 成全视频免费观看在线看| 亚洲色欲啪啪久久WWW综合网| 亚洲国产综合人成综合网站| 久久国产乱子伦精品免费强| 亚洲乱码av中文一区二区| 人人狠狠综合久久亚洲婷婷|