一鍵生成 16 秒 1080P 視頻,國產 Sora 的秘密,藏在這個清華系大模型團隊中
AIGC動態歡迎閱讀
原標題:一鍵生成 16 秒 1080P 視頻,國產 Sora 的秘密,藏在這個清華系大模型團隊中
關鍵字:模型,視頻,架構,報告,科技
文章來源:Founder Park
內容字數:8513字
內容摘要:
2024 年,Sora 一直活在聚光燈下。
馬斯克不惜溢美之詞,稱「人類愿賭服輸」;紅衣教主周鴻祎眼中,借助 Sora 人類實現 AGI 將縮減至一兩年。就連賣付費課程的微商,也拿「Sora」重新組裝了自己的鐮刀。
這種狂熱的蔓延,從美國到中國,從一級到二級甚至再到市場,像漣漪一樣,播散向全世界。
因為,在理想情況下,長視頻生成的底層邏輯,約等于世界模型。十幾秒、幾十秒的視頻中,包含了基礎的圖像處理、空間關系、物理規律、因果邏輯等等現實規律與知識的映射。小處看,可以掀翻傳統電影、游戲制作的桌子,大處看,通往通用人工智能,這是關鍵一步。
同時,在一眾長視頻生成算法中,Sora 的技術突破是具備性的。相比傳統的 Stable Diffusion,Sora 采用的 Diffusion 加 Transformer 架構,既克服了 Stable Diffusion 擴展性的缺失,更是在生成內容的準確性和靈活性上有了質的飛躍。
唯一美中不足是,Sora 并非開源算法。
沒了開源,也就沒了復現的可能;沒了復現可能,那么哪怕經管出身的合伙人睡前讀物變成了《Scalable diffusion
原文鏈接:一鍵生成 16 秒 1080P 視頻,國產 Sora 的秘密,藏在這個清華系大模型團隊中
聯系作者
文章來源:Founder Park
作者微信:Founder-Park
作者簡介:來自極客公園,專注與科技創業者聊「真問題」。
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...