AIGC動態歡迎閱讀
原標題:在線可玩!智譜開源圖生視頻模型,網友直呼Amazing!
關鍵字:視頻,模型,字幕,團隊,提示
文章來源:量子位
內容字數:0字
內容摘要:
叨樂 發自 凹非寺量子位 | 公眾號 QbitAI剛剛,智譜把清影背后的圖生視頻模型CogVideoX-5B-I2V給開源了!(在線可玩)
一起開源的還有它的標注模型cogvlm2-llama3-caption。在實際應用中,CogVideoX-5B-I2V支持「一張圖」+「提示詞」生成視頻。
而cogvlm2-llama3-caption則是負責將視頻內容轉換成文本描述。
不過用過的網友卻對它的表現褒貶不一:
有人在用過之后直呼Amazing。
也有人試了半天,最后還是選擇了CogVideoX之前的版本,還夸夸說:我最看好這個型號!
所以到底效果如何,咱們來實測一波!
實測CogVideoX-5B-I2V測試開始~輸入提示詞:咖啡店員握住雙手笑著對客人表示歡迎,說話時身體自然活動(依舊是老生常談的“手部”問題)
第二次實測,試了一下簡短提示詞:嗎嘍顛著二郎腿打電話(效果不理想,主體還是靜態的沒有動起來)
第三次的提示詞是:“明月圓圓,幾個人坐在河邊談心說話,舉杯高歌。”顯示生成完成,但是到最后顯示環節卻直接NAN了(嗚嗚嗚)
整體效果有些一言難盡,而且生成速度有些慢。
咱們還是來看一
原文鏈接:在線可玩!智譜開源圖生視頻模型,網友直呼Amazing!
聯系作者
文章來源:量子位
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...