CVPR 2024 | 合成視頻數據集里只有單人數據？M3Act人群行為標注難題

AIGC動態1年前 (2024)發布機器之心

CVPR 2024 | 合成視頻數據集里只有單人數據？M3Act破解人群行為標注難題

AIGC動態歡迎閱讀

原標題：CVPR 2024 | 合成視頻數據集里只有單人數據？M3Act人群行為標注難題
關鍵字：群體,數據,模型,任務,基線
文章來源：機器之心
內容字數：0字

內容摘要：

AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年，機器之心AIxiv專欄接收報道了2000多篇內容，覆蓋全球各大高校與企業的頂級實驗室，有效促進了學術交流與傳播。如果您有優秀的工作想要分享，歡迎投稿或者聯系報道。投稿郵箱：liyazhou@jiqizhixin.com；zhaoyunfeng@jiqizhixin.com論文鏈接：https://arxiv.org/abs/2306.16772
項目鏈接：https://cjerry1243.github.io/M3Act/
論文標題：M3Act: Learning from Synthetic Human Group Activities
引言
通過視覺信息識別、理解人群的行為是視頻監測、交互機器人、自動駕駛等領域的關鍵技術之一，但獲取大規模的人群行為標注數據成為了相關研究的發展瓶頸。如今，合成數據集正成為一種新興的，用于替代現實世界數據的方法，但已有研究中的合成數據集主要聚焦于人體姿態與形狀的估計。它們往往只提供單個人物的合成動畫視頻，而這并不適用于人群的視頻識別任務。在這篇文章中，作者提出了一個適用于多群組人群行為的合成

原文鏈接：CVPR 2024 | 合成視頻數據集里只有單人數據？M3Act人群行為標注難題