AIGC動態歡迎閱讀
原標題:ECCV 2024 | 探索離散Token視覺生成中的自適應推理策略
關鍵字:模型,策略,樣本,函數,網絡
文章來源:機器之心
內容字數:0字
內容摘要:
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術交流與傳播。如果您有優秀的工作想要分享,歡迎投稿或者聯系報道。投稿郵箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com本論文第一作者倪贊林是清華大學自動化系 2022 級直博生,師從黃高副教授,主要研究方向為高效深度學習與圖像生成。他曾在 ICCV、CVPR、ECCV、ICLR 等國際會議上發表多篇學術論文。
近年來, AIGC 領域發展十分迅猛。在計算機視覺中,擴散模型已經成為一種有效且常用的模型。相反,在自然語言處理領域,內容的生成通常通過使用 Transformer 去生成離散的 token。受到這種差異的啟發,越來越多的研究(以 VQGAN 作為典型代表)開始探索這種基于離散 token 的生成范式在視覺合成中的應用。與擴散模型不同,這些方法采用類似于語言模型的離散 token 作為生成的基本單元。
為什么要探索基于離散 token 的生成模型?我們認為主要有以下幾點
原文鏈接:ECCV 2024 | 探索離散Token視覺生成中的自適應推理策略
聯系作者
文章來源:機器之心
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...