AIGC動態歡迎閱讀
原標題:浙大李璽團隊:指代表達理解新方法,ScanFormer粗到細迭代消除視覺冗余
關鍵字:尺度,特征,圖像,模型,區域
文章來源:機器之心
內容字數:0字
內容摘要:
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術交流與傳播。如果您有優秀的工作想要分享,歡迎投稿或者聯系報道。投稿郵箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com該論文作者均來自于浙江大學李璽教授團隊,論文第一作者為博士生蘇偉同學,通訊作者為李璽教授(IET Fellow,國家杰青)。李璽教授團隊近年來在國際權威期刊(如 TPAMI、IJCV 等)和國際頂級學術會議(ICCV、CVPR、ECCV 等)上發表 180 余篇 CV/AIGC 相關的研究工作,和國內外知名高校、科研機構廣泛開展合作。
作為基礎的視覺語言任務,指代表達理解(referring expression comprehension, REC)根據自然語言描述來定位圖中被指代的目標。REC 模型通常由三部分組成:視覺編碼器、文本編碼器和跨模態交互,分別用于提取視覺特征、文本特征和跨模態特征特征交互與增強。
目前的研究大多集中在設計高效的跨模態交互模塊以
原文鏈接:浙大李璽團隊:指代表達理解新方法,ScanFormer粗到細迭代消除視覺冗余
聯系作者
文章來源:機器之心
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...