<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        字節(jié)豆包、武大提出 CAL:通過視覺相關(guān)的 token 增強多模態(tài)對齊效果

        AIGC動態(tài)1年前 (2024)發(fā)布 機器之心
        457 0 0

        字節(jié)豆包、武大提出 CAL:通過視覺相關(guān)的 token 增強多模態(tài)對齊效果

        AIGC動態(tài)歡迎閱讀

        原標題:字節(jié)豆包、武大提出 CAL:通過視覺相關(guān)的 token 增強多模態(tài)對齊效果
        關(guān)鍵字:字節(jié)跳動,模型,文本,圖片,豆包
        文章來源:機器之心
        內(nèi)容字數(shù):0字

        內(nèi)容摘要:


        AIxiv專欄是機器之心發(fā)布學術(shù)、技術(shù)內(nèi)容的欄目。過去數(shù)年,機器之心AIxiv專欄接收報道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級實驗室,有效促進了學術(shù)交流與傳播。如果您有優(yōu)秀的工作想要分享,歡迎投稿或者聯(lián)系報道。投稿郵箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com當前主流的視覺語言模型(VLM)主要基于大語言模型(LLM)進一步微調(diào)。因此需要通過各種方式將圖像映射到 LLM 的嵌入空間,然后使用自回歸方式根據(jù)圖像 token 預測答案。
        在這個過程中,模態(tài)的對齊是通過文本 token 隱式實現(xiàn)的,如何做好這一步的對齊非常關(guān)鍵。
        針對這一問題,大學、字節(jié)跳動豆包大模型團隊和中國科學院大學的研究人員提出了一種基于對比學習的文本 token 篩選方法(CAL),從文本中篩選出與圖像高度相關(guān)的 token,并加大其損失函數(shù)權(quán)重,從而實現(xiàn)更精準的多模態(tài)對齊。論文鏈接:https://arxiv.org/pdf/2405.17871
        代碼鏈接:https://github.com/foundation-multimodal-m


        原文鏈接:字節(jié)豆包、武大提出 CAL:通過視覺相關(guān)的 token 增強多模態(tài)對齊效果

        聯(lián)系作者

        文章來源:機器之心
        作者微信:almosthuman2014
        作者簡介:專業(yè)的人工智能媒體和產(chǎn)業(yè)服務平臺

        閱讀原文
        ? 版權(quán)聲明
        蟬鏡AI數(shù)字人

        相關(guān)文章

        蟬鏡AI數(shù)字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: A片在线免费观看| 日本黄页网站免费| 97公开免费视频| 一个人在线观看视频免费| 国产性生交xxxxx免费| 久久精品国产亚洲夜色AV网站| 亚洲午夜精品国产电影在线观看| 男男gay做爽爽免费视频| 免费国产黄网站在线观看视频| 国产免费资源高清小视频在线观看| 亚洲av日韩av无码| 无码日韩人妻AV一区免费l| 成人免费视频69| 国产亚洲综合色就色| 色天使色婷婷在线影院亚洲| 免费观看无遮挡www的视频| 亚洲欧洲日产国码无码网站| 韩国亚洲伊人久久综合影院| 四虎影院永久免费观看| 国产中文字幕在线免费观看| 免费jjzz在线播放国产| 亚洲夂夂婷婷色拍WW47| 美女视频黄免费亚洲| 亚洲系列国产精品制服丝袜第| 三年片免费高清版 | 最近中文字幕完整免费视频ww| 亚洲综合色一区二区三区小说| av免费不卡国产观看| 亚洲av成人一区二区三区观看在线 | 中文字幕成人免费视频| 国产亚洲精品影视在线| 久草免费在线观看视频| 亚洲AV噜噜一区二区三区| 人人狠狠综合久久亚洲婷婷| 久久av免费天堂小草播放| 亚洲一级特黄无码片| gogo免费在线观看| 狠狠色婷婷狠狠狠亚洲综合| 无码人妻一区二区三区免费视频| 亚洲欧洲在线观看| 18成禁人视频免费网站|