AIGC動態歡迎閱讀
原標題:全球首個類Sora開源復現方案來了!全面公開所有訓練細節和模型權重
關鍵字:視頻,模型,解讀,數據,注意力
文章來源:量子位
內容字數:6648字
內容摘要:
明敏 發自 凹非寺量子位 | 公眾號 QbitAI全球首個開源的類Sora架構視頻生成模型,來了!
整個訓練流程,包括數據處理、所有訓練細節和模型權重,全部開放。
這就是剛剛發布的Open-Sora 1.0。
它帶來的實際效果如下,能生成繁華都市夜景中的車水馬龍。
還能用航拍視角,展現懸崖海岸邊,海水拍打著巖石的畫面。
亦或是延時攝影下的浩瀚星空。
自Sora發布以來,由于效果驚艷但技術細節寥寥,揭秘、復現Sora成為了開發社區最熱議話題之一。比如Colossal-AI團隊推出成本直降46%的Sora訓練推理復現流程。
短短兩周時間后,該團隊再次發布最新進展,復現類Sora方案,并將技術方案及詳細上手教程在GitHub上免費開源。
那么問題來了,復現Sora如何實現?
Open-Sora 開源地址:https://github.com/hpcaitech/Open-Sora
全面解讀Sora復現方案Sora復現方案包括四個方面:
模型架構設計
訓練復現方案
數據預處理
高效訓練優化策略
模型架構設計模型采用了Sora同源架構Diffusion Transformer (DiT) 。
它
原文鏈接:全球首個類Sora開源復現方案來了!全面公開所有訓練細節和模型權重
聯系作者
文章來源:量子位
作者微信:QbitAI
作者簡介:追蹤人工智能新趨勢,關注科技行業新突破
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...