<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        字節發布視覺基礎模型ViTamin,多項任務實現SOTA,入選CVPR2024

        AIGC動態1年前 (2024)發布 量子位
        407 0 0

        字節發布視覺基礎模型ViTamin,多項任務實現SOTA,入選CVPR2024

        AIGC動態歡迎閱讀

        原標題:字節發布視覺基礎模型ViTamin,多項任務實現SOTA,入選CVPR2024
        關鍵字:字節跳動,模型,視覺,準確率,特征
        文章來源:量子位
        內容字數:4381字

        內容摘要:


        允中 發自 凹非寺量子位 | 公眾號 QbitAI視覺語言模型屢屢出現新突破,但ViT仍是圖像編碼器的首選網絡結構。
        字節提出新基礎模型——ViTamin,專為視覺語言時代設計。
        在使用相同的數據集和訓練方案時,ViTamin在ImageNet零樣本準確率上比ViT提高了2.0%。
        此外在分類、檢索、開放詞匯檢測和分割、多模態大語言模型等60個不同基準上都表現出了良好的結果。
        當進一步擴展參數規模時,ViTamin-XL僅有436M參數,卻達到了82.9%的ImageNet零樣本準確率,超過了擁有十倍參數(4.4B)的EVA-E。
        最終這一成果,入選計算機視覺頂會CVPR2024。
        視覺語言時代新基準在視覺語言時代下,如何設計一個更好可擴展的視覺模型?
        在ImageNet時代,新的視覺模型在ImageNet數據集得以驗證,也造就了不斷有新的視覺模型涌現。但在視覺語言時代,新的視覺模型鮮為人見。
        此外,基于現有常見視覺模型,在面對比ImageNet數據規模還大的情況下表現又是如何?研究團隊們測試了幾種常見模型,包括純Transformer的ViT,純卷積網絡的ConvNeXt,以及混合卷


        原文鏈接:字節發布視覺基礎模型ViTamin,多項任務實現SOTA,入選CVPR2024

        聯系作者

        文章來源:量子位
        作者微信:QbitAI
        作者簡介:追蹤人工智能新趨勢,關注科技行業新突破

        閱讀原文
        ? 版權聲明
        Trae官網

        相關文章

        Trae官網

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 亚洲人成黄网在线观看| 国产自偷亚洲精品页65页| 久久综合亚洲色HEZYO社区| 国产啪精品视频网站免费尤物| 亚洲国产精品自在拍在线播放 | 一级成人a免费视频| 亚洲国产专区一区| 国产高清视频免费在线观看| 国产精品亚洲w码日韩中文| 中文字幕乱理片免费完整的| 亚洲乳大丰满中文字幕| 日韩电影免费在线观看中文字幕| 久久久亚洲欧洲日产国码农村| 免费污视频在线观看| 亚洲色欲www综合网| 成人性生交大片免费看午夜a| 中文无码亚洲精品字幕| 国产午夜无码视频免费网站| 污污污视频在线免费观看| 在线观看午夜亚洲一区| 欧洲精品99毛片免费高清观看| 亚洲色图校园春色| 午夜一区二区免费视频| 成人一级免费视频| 亚洲Av无码精品色午夜 | 57pao一国产成永久免费| 国产精品亚洲片在线va| 亚洲 无码 在线 专区| 久久精品免费一区二区三区| 亚洲人成网站在线观看播放动漫| 日韩一品在线播放视频一品免费| 黄色片网站在线免费观看| 亚洲色偷拍另类无码专区| 国产va精品免费观看| 一个人免费观看日本www视频| 久久亚洲一区二区| 国产乱色精品成人免费视频| 久久永久免费人妻精品| 亚洲成a人无码亚洲成av无码| 国产成人亚洲精品狼色在线| 野花高清在线观看免费完整版中文 |