優(yōu)雅之道:經(jīng)典卡爾曼濾波器在視頻分割中的創(chuàng)新應(yīng)用
移動(dòng)再快也跟丟不了
原標(biāo)題:經(jīng)典卡爾曼濾波器改進(jìn)視頻版「分割一切」,網(wǎng)友:好優(yōu)雅的方法
文章來(lái)源:量子位
內(nèi)容字?jǐn)?shù):5284字
Segment Anything Model 2(SAM 2)的改進(jìn):SAMURAI
在量子位的最新報(bào)道中,由華盛頓大學(xué)全華人團(tuán)隊(duì)提出的改進(jìn)版Segment Anything Model 2(SAM 2)——SAMURAI,再次引發(fā)了廣泛關(guān)注。該團(tuán)隊(duì)利用經(jīng)典的卡爾曼濾波器技術(shù),成功提升了模型在復(fù)雜動(dòng)態(tài)場(chǎng)景下的目標(biāo)跟蹤能力,尤其是在快速移動(dòng)和遮擋情況下的表現(xiàn)。
1. SAM 2的局限性
SAM 2在處理視覺(jué)目標(biāo)跟蹤時(shí),尤其是在擁擠場(chǎng)景中,由于忽視線索,常常出現(xiàn)跟丟現(xiàn)象。當(dāng)目標(biāo)快速移動(dòng)或被遮擋時(shí),模型傾向于依賴外觀相似性,導(dǎo)致跟蹤錯(cuò)誤。
2. SAMURAI的技術(shù)提升
SAMURAI的核心在于兩個(gè)關(guān)鍵技術(shù):建模和感知記憶選擇。建模通過(guò)卡爾曼濾波器有效預(yù)測(cè)目標(biāo),提高在復(fù)雜場(chǎng)景中的跟蹤準(zhǔn)確性。感知記憶選擇則通過(guò)動(dòng)態(tài)選擇最相關(guān)的幀,避免低質(zhì)量特征對(duì)后續(xù)跟蹤的干擾。
3. 實(shí)驗(yàn)結(jié)果與應(yīng)用
實(shí)驗(yàn)表明,SAMURAI在多個(gè)視覺(jué)目標(biāo)跟蹤基準(zhǔn)(如LaSOT、LaSOText和GOT-10k)上表現(xiàn)優(yōu)異,超越了SAM 2,并與一些有監(jiān)督方法相媲美。該模型能夠?qū)崟r(shí)運(yùn)行,無(wú)需重新訓(xùn)練或微調(diào),實(shí)用性極強(qiáng)。
4. 研究團(tuán)隊(duì)介紹
該項(xiàng)目研究團(tuán)隊(duì)由華盛頓大學(xué)電氣與計(jì)算機(jī)工程系的博士生和研究生組成,團(tuán)隊(duì)成員包括Cheng-Yen Yang、Hsiang-Wei Huang、Zhongyu Jiang和Wenhao Chai,導(dǎo)師為IEEE院士Jenq-Neng Hwang。
5. 結(jié)論
SAMURAI的成功展示了經(jīng)典方法在現(xiàn)代人工智能模型中的有效性,證明了有時(shí)候簡(jiǎn)單而經(jīng)典的技術(shù)可以為復(fù)雜問(wèn)題提供優(yōu)雅的解決方案。
更多信息可訪問(wèn)項(xiàng)目主頁(yè)與論文鏈接,了解SAMURAI的更多技術(shù)細(xì)節(jié)和應(yīng)用案例。
聯(lián)系作者
文章來(lái)源:量子位
作者微信:
作者簡(jiǎn)介:追蹤人工智能新趨勢(shì),關(guān)注科技行業(yè)新突破