中國的開源版 sora：4090 內單卡運行，A6000 可微調

AIGC動態1年前 (2024)發布 AI科技評論

AIGC動態歡迎閱讀

原標題：中國的開源版 sora：4090 內單卡運行，A6000 可微調
關鍵字：視頻,模型,報告,字幕,數據
文章來源：AI科技評論
內容字數：0字

內容摘要：

智譜版 Sora「清影」正式開源，第一個開源的商用級視頻生成模型。7 月 26 日，智譜發布AI 生視頻產品「清影」，30秒將任意文圖生成視頻，并上線在他們的AI助手「智譜清言」上，被譽為是國內首個人人可用的Sora。發布 6 天，「清影」生成視頻數就突破百萬量級。
今天，智譜AI宣布將與「清影」同源的視頻生成模型——CogVideoX開源，以期讓每一位開發者、每一家企業都能地開發屬于自己的視頻生成模型，從而推動整個行業的快速迭代與創新發展。
隨著大型模型技術的持續發展，視頻生成技術正逐步走向成熟。以Sora、Gen-3等閉源視頻生成模型為代表的技術，正在重新定義行業的未來格局。然而，截至目前，仍未有一個開源的視頻生成模型，能夠滿足商業級應用的要求。
CogVideoX開源模型包含多個不同尺寸大小的模型，目前智譜開源CogVideoX-2B，它在FP-16精度下的推理僅需18GB顯存，微調則只需要40GB顯存，這意味著單張4090顯卡即可進行推理，而單張A6000顯卡即可完成微調。
CogVideoX-2B的提示詞上限為226個token，視頻長度為6秒，幀率為8幀/秒，視頻分辨率

原文鏈接：中國的開源版 sora：4090 內單卡運行，A6000 可微調