AIGC動態歡迎閱讀
原標題:國內公司有望做出Sora嗎?這支清華系大模型團隊給出了希望
關鍵字:架構,視頻,模型,數據,報告
文章來源:機器之心
內容字數:16966字
內容摘要:
機器之心原創
作者:張倩在 Sora 代表的視頻生成路線上,國內公司其實已有一定的技術儲備。2023 年年底,很多人都預測,未來一年將是視頻生成快速發展的一年。但出人意料的是,農歷春節剛過,OpenAI 就扔出了一個重磅 —— 能生成 1 分鐘流暢、逼真視頻的 Sora。它的出現讓很多研究者擔心:國內外 AI 技術的差距是不是又拉大了?Sora 生成的新視頻
根據 OpenAI 披露的技術報告,Sora 的核心技術點之一是將視覺數據轉化為 patch 的統一表示形式,并通過 Transformer 和擴散模型結合,展現了卓越的 scale 特性。無獨有偶,最近發布的 Stable Diffusion 3 也采用了同樣的架構。
其實,這兩項工作都是基于 Sora 核心研發成員 William Peebles 和紐約大學計算機科學助理教授謝賽寧合著的一篇論文《Scalable Diffusion Models with Transformers》。這篇論文提出了一種基于 Transformer 架構的新型擴散模型 ——DiT,用對潛在 patch 進行操作的 Transformer 替
原文鏈接:國內公司有望做出Sora嗎?這支清華系大模型團隊給出了希望
聯系作者
文章來源:機器之心
作者微信:almosthuman2014
作者簡介:專業的人工智能媒體和產業服務平臺
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...