<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        字節提出視覺基礎模型ViTamin,多項任務實現SOTA,入選CVPR2024

        AIGC動態1年前 (2024)發布 算法邦
        517 0 0

        字節提出視覺基礎模型ViTamin,多項任務實現SOTA,入選CVPR2024

        AIGC動態歡迎閱讀

        原標題:字節提出視覺基礎模型ViTamin,多項任務實現SOTA,入選CVPR2024
        關鍵字:字節跳動,模型,侵權,視覺,準確率
        文章來源:算法邦
        內容字數:4384字

        內容摘要:


        文章轉載自公眾號:量子位,本文只做學術/技術分享,如有侵權,聯系刪文。
        視覺語言模型屢屢出現新突破,但ViT仍是圖像編碼器的首選網絡結構。
        字節提出新基礎模型——ViTamin,專為視覺語言時代設計。
        在使用相同的數據集和訓練方案時,ViTamin在ImageNet零樣本準確率上比ViT提高了2.0%。
        此外在分類、檢索、開放詞匯檢測和分割、多模態大語言模型等60個不同基準上都表現出了良好的結果。
        當進一步擴展參數規模時,ViTamin-XL僅有436M參數,卻達到了82.9%的ImageNet零樣本準確率,超過了擁有十倍參數(4.4B)的EVA-E。
        最終這一成果,入選計算機視覺頂會CVPR2024。
        01視覺語言時代新基準在視覺語言時代下,如何設計一個更好可擴展的視覺模型?
        在ImageNet時代,新的視覺模型在ImageNet數據集得以驗證,也造就了不斷有新的視覺模型涌現。但在視覺語言時代,新的視覺模型鮮為人見。
        此外,基于現有常見視覺模型,在面對比ImageNet數據規模還大的情況下表現又是如何?研究團隊們測試了幾種常見模型,包括純Transformer的ViT,純卷積網絡的C


        原文鏈接:字節提出視覺基礎模型ViTamin,多項任務實現SOTA,入選CVPR2024

        聯系作者

        文章來源:算法邦
        作者微信:allplusai
        作者簡介:智猩猩矩陣賬號之一,聚焦生成式AI,重點關注模型與應用。

        閱讀原文
        ? 版權聲明
        Trae官網

        相關文章

        Trae官網

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 亚洲AV网站在线观看| 国产成人亚洲精品91专区手机 | va天堂va亚洲va影视中文字幕 | 亚洲免费视频播放| 免费国产黄网站在线观看| 亚洲av无码乱码国产精品| 亚洲最大福利视频| 91精品国产免费久久久久久青草| 亚洲人成电影亚洲人成9999网| 亚洲色大成网站www永久网站| 一级黄色免费大片| 中文字幕在亚洲第一在线| 亚洲人成网站18禁止久久影院| 在线观看免费人成视频色9| 亚洲综合av一区二区三区不卡 | 亚洲国产婷婷香蕉久久久久久| 久久亚洲精品中文字幕| 1000部啪啪未满十八勿入免费| 亚洲AⅤ视频一区二区三区| 一个人看的在线免费视频| 亚洲国产精品VA在线观看麻豆| 香蕉视频免费在线| 亚洲色无码专区在线观看| 免费人成大片在线观看播放电影| 精品亚洲视频在线观看| 91免费福利视频| 亚洲片国产一区一级在线观看| 国产做国产爱免费视频| 久久亚洲精品无码aⅴ大香| 中文字幕日本人妻久久久免费| 亚洲天天做日日做天天欢毛片| 最近最好的中文字幕2019免费 | 暖暖免费高清日本中文| 亚洲精品视频免费观看| 亚洲男人天堂影院| 国产三级电影免费观看| 无码日韩精品一区二区免费暖暖| 亚洲激情视频图片| 国精无码欧精品亚洲一区| 最新欧洲大片免费在线| 久久久久久久国产免费看|