AIGC動態歡迎閱讀
原標題:CVPR 2024|讓圖像擴散模型生成高質量360度場景,只需要一個語言模型
關鍵字:模型,場景,報告,圖像,語言
文章來源:機器之心
內容字數:0字
內容摘要:
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術交流與傳播。如果您有優秀的工作想要分享,歡迎投稿或者聯系報道。投稿郵箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com蔡志鵬博士(https://zhipengcai.github.io/)是美國英特爾研究院的研究員,博士畢業于澳大利亞阿德萊德大學。他的研究興趣包括魯棒視覺感知,持續學習和生成模型等。他的工作已在領域頂級會議雜志上發表超過15篇。其中5篇文章被選為頂級會議(ECCV18*2,ICCV19,ICLR24,CVPR24)口頭或特邀報告,對魯棒估計計算復雜度的理論證明工作被選為ECCV18 12篇最佳論文之一。
360 度場景生成是計算機視覺的重要任務,主流方法主要可分為兩類,一類利用圖像擴散模型分別生成 360 度場景的多個視角。由于圖像擴散模型缺乏場景全局結構的先驗知識,這類方法無法有效生成多樣的 360 度視角,導致場景內主要的目標被多次重復生成,如圖 1 的
原文鏈接:CVPR 2024|讓圖像擴散模型生成高質量360度場景,只需要一個語言模型
聯系作者
文章來源:機器之心
作者微信:almosthuman2014
作者簡介:專業的人工智能媒體和產業服務平臺
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...