CVPR 2024 | 字節提出新一代數據集COCONut，比COCO粒度分割更密集

AIGC動態1年前 (2024)發布機器之心

AIGC動態歡迎閱讀

原標題：CVPR 2024 | 字節提出新一代數據集COCONut，比COCO粒度分割更密集
關鍵字：字節跳動,數據,模型,語義,全景
文章來源：機器之心
內容字數：3726字

內容摘要：

AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年，機器之心AIxiv專欄接收報道了2000多篇內容，覆蓋全球各大高校與企業的頂級實驗室，有效促進了學術交流與傳播。如果您有優秀的工作想要分享，歡迎投稿或者聯系報道。投稿郵箱：liyazhou@jiqizhixin.com；zhaoyunfeng@jiqizhixin.com。隨著人工智能的發展，語言模型和生成模型獲得了大量的成功并且在設計模型的過程中，模型的參數量也越來越大。對于細粒度理解任務，模型參數量也同樣在增加。然而目前現有的數據集存在規模和精度的矛盾，例如 SA-1B 數據集中 99.1% 的 mask 都是機器生成的，但沒有賦予語義的標簽，而其他一些公開數據集也同樣存在精度問題并且這些數據集的規模一般都比較小。
近期，字節跳動提出了新一代細粒度理解的數據集，針對當代深度學習模型的設計需求，給總量為 383K 的圖片進行了全景分割的人工標注，最后達到了 5.18M 張 mask，是至今最大規模的帶人工標簽的全景分割理解數據集，命名為 COCONut。該成果已入選 CVPR2024。論文鏈接：https://arxiv.o

原文鏈接：CVPR 2024 | 字節提出新一代數據集COCONut，比COCO粒度分割更密集