在線可玩!智譜開源圖生視頻模型,網(wǎng)友直呼Amazing!

AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:在線可玩!智譜開源圖生視頻模型,網(wǎng)友直呼Amazing!
關(guān)鍵字:視頻,模型,字幕,團(tuán)隊(duì),提示
文章來源:量子位
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
叨樂 發(fā)自 凹非寺量子位 | 公眾號 QbitAI剛剛,智譜把清影背后的圖生視頻模型CogVideoX-5B-I2V給開源了!(在線可玩)
一起開源的還有它的標(biāo)注模型cogvlm2-llama3-caption。在實(shí)際應(yīng)用中,CogVideoX-5B-I2V支持「一張圖」+「提示詞」生成視頻。
而cogvlm2-llama3-caption則是負(fù)責(zé)將視頻內(nèi)容轉(zhuǎn)換成文本描述。
不過用過的網(wǎng)友卻對它的表現(xiàn)褒貶不一:
有人在用過之后直呼Amazing。
也有人試了半天,最后還是選擇了CogVideoX之前的版本,還夸夸說:我最看好這個(gè)型號!
所以到底效果如何,咱們來實(shí)測一波!
實(shí)測CogVideoX-5B-I2V測試開始~輸入提示詞:咖啡店員握住雙手笑著對客人表示歡迎,說話時(shí)身體自然活動(dòng)(依舊是老生常談的“手部”問題)
第二次實(shí)測,試了一下簡短提示詞:嗎嘍顛著二郎腿打電話(效果不理想,主體還是靜態(tài)的沒有動(dòng)起來)
第三次的提示詞是:“明月圓圓,幾個(gè)人坐在河邊談心說話,舉杯高歌。”顯示生成完成,但是到最后顯示環(huán)節(jié)卻直接NAN了(嗚嗚嗚)
整體效果有些一言難盡,而且生成速度有些慢。
咱們還是來看一
原文鏈接:在線可玩!智譜開源圖生視頻模型,網(wǎng)友直呼Amazing!
聯(lián)系作者
文章來源:量子位
作者微信:
作者簡介:

粵公網(wǎng)安備 44011502001135號