AIGC動態歡迎閱讀
原標題:NeurIPS 2024 | 消除多對多問題,清華提出大規模細粒度視頻片段標注新范式VERIFIED
關鍵字:視頻,模型,數據,文本,片段
文章來源:機器之心
內容字數:0字
內容摘要:
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術交流與傳播。如果您有優秀的工作想要分享,歡迎投稿或者聯系報道。投稿郵箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com陳厚倫,清華大學計算機系媒體所的二年級博士生,主要研究方向是多模態大模型與視頻理解 ,在 NeurIPS 、ACM Multimedia 等頂級會議發表多篇論文,曾獲國家獎學金、北京市優秀本科畢業生等。
視頻內容的快速增長給視頻檢索技術,特別是細粒度視頻片段檢索(VCMR),帶來了巨大挑戰。VCMR 要求系統根據文本查詢從視頻庫中精準定位視頻中的匹配片段,需具備跨模態理解和細粒度視頻理解能力。
然而,現有研究多局限于粗粒度理解,難以應對細粒度查詢。為此,來自清華大學的研究者提出自動化視頻 – 文本細粒度標注系統 VERIFIED,并基于此系統構建新的細粒度 VCMR 基準數據集(Charades-FIG、DiDeMo-FIG 和 ActivityNet-FIG
原文鏈接:NeurIPS 2024 | 消除多對多問題,清華提出大規模細粒度視頻片段標注新范式VERIFIED
聯系作者
文章來源:機器之心
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...