目標(biāo)檢測(cè)新SOTA,端側(cè)實(shí)時(shí)識(shí)別,沈向洋罕見(jiàn)轉(zhuǎn)發(fā)點(diǎn)贊
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:目標(biāo)檢測(cè)新SOTA,端側(cè)實(shí)時(shí)識(shí)別,沈向洋罕見(jiàn)轉(zhuǎn)發(fā)點(diǎn)贊
關(guān)鍵字:模型,數(shù)據(jù),領(lǐng)域,版本,目標(biāo)
文章來(lái)源:量子位
內(nèi)容字?jǐn)?shù):3156字
內(nèi)容摘要:
白交 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI目標(biāo)檢測(cè)領(lǐng)域,迎來(lái)了新進(jìn)展——
Grounding DINO 1.5,IDEA研究院團(tuán)隊(duì)出品,在端側(cè)就可實(shí)現(xiàn)實(shí)時(shí)識(shí)別。
這一進(jìn)展獲得AI大佬沈向洋轉(zhuǎn)發(fā),他一般都是一年一轉(zhuǎn)的節(jié)奏。
此次發(fā)布主要有兩個(gè)版本:Pro和Edge。Pro版更強(qiáng),Edge版更快。
它仍然保留了上一個(gè)版本Grounding DINO雙編碼器-單解碼器結(jié)構(gòu),在此基礎(chǔ)上通過(guò)結(jié)合更大的視覺(jué) backbone 擴(kuò)大模型尺寸,并使用超過(guò)2000萬(wàn)的Grounding 數(shù)據(jù)獲得了豐富的語(yǔ)料,大幅提升了檢測(cè)精度和速度,且通過(guò)Pro和Edge版本分別針對(duì)不同應(yīng)用場(chǎng)景進(jìn)行了優(yōu)化。
Pro版本在大規(guī)模數(shù)據(jù)集構(gòu)建和高精度需求場(chǎng)景中表現(xiàn)卓越,而Edge版本則在端側(cè)部署中展示了其獨(dú)特的優(yōu)勢(shì)。
這就來(lái)分別看一看。
Pro版目標(biāo)檢測(cè)新SOTAGrounding DINO 1.5 Pro版本實(shí)現(xiàn)了當(dāng)前開(kāi)集目標(biāo)檢測(cè)SOTA水平,在圖像和文本的語(yǔ)義理解上表現(xiàn)出色,能夠快速、準(zhǔn)確地根據(jù)語(yǔ)言提示檢測(cè)和識(shí)別圖像中的目標(biāo)對(duì)象。
△在COCO、LVIS、ODinW35和ODinW13基準(zhǔn)測(cè)試中的零樣本遷移性能對(duì)
原文鏈接:目標(biāo)檢測(cè)新SOTA,端側(cè)實(shí)時(shí)識(shí)別,沈向洋罕見(jiàn)轉(zhuǎn)發(fā)點(diǎn)贊
聯(lián)系作者
文章來(lái)源:量子位
作者微信:QbitAI
作者簡(jiǎn)介:追蹤人工智能新趨勢(shì),關(guān)注科技行業(yè)新突破