Latte一作馬鑫：DiT架構在視頻生成模型中的應用與擴展 | 講座預告

AIGC動態1年前 (2024)發布算法邦

AIGC動態歡迎閱讀

原標題：Latte一作馬鑫：DiT架構在視頻生成模型中的應用與擴展 | 講座預告
關鍵字：視頻,模型,猩猩,人工智能,架構
文章來源：算法邦
內容字數：0字

內容摘要：

「智猩猩AI新青年講座」由智猩猩出品，致力于邀請青年學者，主講他們在生成式AI、LLM、AI Agent、CV等人工智能領域的最新重要研究成果。
AI新青年是加速人工智能前沿研究的新生力量。AI新青年的視頻講解和直播答疑，將可以幫助大家增進對人工智能前沿研究的理解，相應領域的專業知識也能夠得以積累加深。同時，通過與AI新青年的直接交流，大家在AI學習和應用AI的過程中遇到的問題，也能夠盡快解決。
「智猩猩AI新青年講座」現已完結238講，錯過往期講座直播的朋友，可以點擊文章底部 “閱讀原文”進行回看！近年來，文字轉視頻模型領域取得了令人矚目的成就。但當前的文本驅動視頻生成模型大多仍依賴于UNet作為核心網絡架構，這一選擇不僅制約了模型性能的提升，還難以實現大規模擴展。相比之下，Transformer架構因適合處理長序列數據和易于規模化而展現出獨特的優勢。
基于以上分析，莫納什大學在讀博士馬鑫聯合上海人工智能實驗室的研究團隊創新地提出了全球首個DiT類文生視頻開源模型Latte，旨在視頻生成領域率先探索構建穩定高效的超大型神經網絡的新途徑。相關論文為《Latte: Latent Diff

原文鏈接：Latte一作馬鑫：DiT架構在視頻生成模型中的應用與擴展 | 講座預告