AIGC動態歡迎閱讀
原標題:北大發起復現Sora,框架已搭!袁粒田永鴻領銜,AnimateDiff大神響應
關鍵字:騰訊,報告,分辨率,北大,視頻
文章來源:量子位
內容字數:4958字
內容摘要:
豐色 發自 凹非寺量子位 | 公眾號 QbitAI重磅:
北大團隊發起了一項Sora復現計劃——Open Sora。
框架、實現細節已出:
初始團隊一共13人:
帶隊的是北大信息工程學院助理教授、博導袁粒和北大計算機學院教授、博導田永鴻等人。
為什么發起這項計劃?
因為資源有限,團隊希望集結開源社區的力量,盡可能完成復現。
消息一出,就有人北大校友兼AnimateDiff貢獻者等人即刻響應:
還有人表示可以提供高質量數據集:
所以,“國產版Sora”的新挑戰者,就這么來了?
計劃細節,已完成3個初步功能首先,來看目前公布的技術細節——即團隊打算如何復現Sora。
整體框架上,它將由三部分組成:
Video VQ-VAE
Denoising Diffusion Transformer(去噪擴散型Transformer)
Condition Encoder(條件編碼器)
這和Sora技術報告的內容基本差不多。
對于Sora視頻的可變長寬比,團隊通過參考上海AI Lab剛剛提出的FiT(Flexible Vision Transformer for Diffusion Model,即“升級版
原文鏈接:北大發起復現Sora,框架已搭!袁粒田永鴻領銜,AnimateDiff大神響應
聯系作者
文章來源:量子位
作者微信:QbitAI
作者簡介:追蹤人工智能新趨勢,關注科技行業新突破
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...