模型描述

Vision Transformer（ViT）是一個transformer編碼器模型（類似于BERT），以自監(jiān)督方式預訓練于一個大型圖像集合（即ImageNet-1k），分辨率為224×224像素。
將圖像作為固定大小的補丁序列（分辨率為16×16）呈現(xiàn)給模型，這些補丁被線性嵌入。在序列開始添加[CLS]令牌以用于分類任務。在將序列提供給Transformer編碼器的層之前，還添加絕對位置嵌入。
請注意，此模型不包括任何微調(diào)頭。
通過預訓練模型，它學習了圖像的內(nèi)部表示，然后可以用于提取對下游任務有用的特征：例如，如果您有一個帶標簽的圖像數(shù)據(jù)集，可以在預訓練的編碼器的頂部放置一個線性層來訓練標準分類器。通常將線性層放置在[CLS]令牌的頂部，因為此令牌的最后隱藏狀態(tài)可以看作是整個圖像的表示。

數(shù)據(jù)統(tǒng)計

數(shù)據(jù)評估

facebook/dino-vitb16瀏覽人數(shù)已經(jīng)達到871，如你需要查詢該站的相關權(quán)重信息，可以點擊"5118數(shù)據(jù)""愛站數(shù)據(jù)""Chinaz數(shù)據(jù)"進入；以目前的網(wǎng)站數(shù)據(jù)參考，建議大家請以愛站數(shù)據(jù)為準，更多網(wǎng)站價值評估因素如：facebook/dino-vitb16的訪問速度、搜索引擎收錄以及索引量、用戶體驗等；當然要評估一個站的價值，最主要還是需要根據(jù)您自身的需求以及需要，一些確切的數(shù)據(jù)則需要找facebook/dino-vitb16的站長進行洽談提供。如該站的IP、PV、跳出率等！

特別聲明

本站OpenI提供的facebook/dino-vitb16都來源于網(wǎng)絡，不保證外部鏈接的準確性和完整性，同時，對于該外部鏈接的指向，不由OpenI實際控制，在2023年 5月 26日下午5:53收錄時，該網(wǎng)頁上的內(nèi)容，都屬于合規(guī)合法，后期網(wǎng)頁的內(nèi)容如出現(xiàn)違規(guī)，可以直接聯(lián)系網(wǎng)站管理員進行刪除，OpenI不承擔任何責任。

OpenI致力于優(yōu)質(zhì)、實用的網(wǎng)絡站點資源收集與分享！本文地址http://www.futurefh.com/sites/10666.html轉(zhuǎn)載請注明