國(guó)產(chǎn)版Sora開(kāi)源了!推理優(yōu)化到18G,4090單卡可跑
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:國(guó)產(chǎn)版Sora開(kāi)源了!推理優(yōu)化到18G,4090單卡可跑
關(guān)鍵字:視頻,模型,報(bào)告,快手,字幕
文章來(lái)源:智東西
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
國(guó)產(chǎn)視頻生成模型又有新進(jìn)展。
作者|ZeR0
編輯|漠影
智東西8月6日?qǐng)?bào)道,好消息,智譜AI的視頻生成模型CogVideoX-2B,昨晚正式開(kāi)源了。
模型已上架GitHub、Hugging Face,F(xiàn)P16精度下的推理僅需18GB顯存,微調(diào)則只需要40GB,單張4090顯卡可推理,單張A6000可微調(diào)。
CogVideoX-2B的提示詞上限為226個(gè)token,視頻長(zhǎng)度為6秒,幀率為8幀/秒,視頻分辨率為720 * 480。
CogVideoX系列開(kāi)源模型與智譜AI的商業(yè)版視頻生成模型“清影”同源。2B版本首發(fā)后,性能更強(qiáng)、參數(shù)量更大的開(kāi)源模型將在后續(xù)上架。
代碼倉(cāng)庫(kù):https://github.com/THUDM/CogVideo
模型下載:
https://huggingface.co/THUDM/CogVideoX-2b
技術(shù)報(bào)告:
https://github.com/THUDM/CogVideo/blob/main/resources/CogVideoX.pdf
根據(jù)論文,CogVideoX在雷達(dá)圖中比其他幾個(gè)視頻生成模型更大,屬性值趨近六邊形。
為了評(píng)估文生視頻的質(zhì)量
原文鏈接:國(guó)產(chǎn)版Sora開(kāi)源了!推理優(yōu)化到18G,4090單卡可跑
聯(lián)系作者
文章來(lái)源:智東西
作者微信:
作者簡(jiǎn)介: