AIGC動態歡迎閱讀
原標題:Meta「分割一切」進化2.0!一鍵跟蹤物體,代碼權重數據集全開源,網友:真正的OpenAI
關鍵字:視頻,對象,模型,記憶,圖像
文章來源:量子位
內容字數:0字
內容摘要:
明敏 發自 凹非寺量子位 | 公眾號 QbitAI又是發布即開源!
Meta“分割一切AI”二代SAM2在SIGGRAPH上剛剛亮相。
相較于上一代,它的能力從圖像分割拓展到視頻分割。
可實時處理任意長視頻,視頻中沒見過的對象也能輕松分割追蹤。
更關鍵的是,模型代碼、權重以及數據集通通開源!
它和Llama系列一樣遵循Apache 2.0許可協議,并根據BSD-3許可分享評估代碼。
網友yygq:我就問OpenAI尷尬不尷尬。
Meta表示,此次開源的數據集包含51000個真實世界視頻和600000個時空掩碼(masklets,spatio-temporal masks),規模遠超此前最大同類數據集。
可在線試玩的demo也同步上線,大家都能來體驗。
在SAM之上加入記憶模塊相較于SAM一代,SAM2的能力升級主要有:
支持任意長視頻實時分割
實現zero-shot泛化
分割和追蹤準確性提升
解決遮擋問題
它進行交互式分割的過程主要分為兩步:選擇和細化。
在第一幀中,用戶通過點擊來選擇目標對象,SAM2根據點擊自動將分割傳播到后續幀,形成時空掩碼。
如果SAM2在某些幀中丟失了目標對象
原文鏈接:Meta「分割一切」進化2.0!一鍵跟蹤物體,代碼權重數據集全開源,網友:真正的OpenAI
聯系作者
文章來源:量子位
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...