AIGC動態歡迎閱讀
原標題:字節跳動推出顛覆性文生視頻模型,可控制動作!
關鍵字:字節跳動,視頻,解讀,侵權,模型
文章來源:AI前線
內容字數:3688字
內容摘要:
來源|AIGC開放社區
在 Sora 引爆文生視頻賽道之前,國內的字節跳動也推出了一款顛覆性視頻模型——Boximator。
與 Gen-2、Pink1.0 等模型不同的是,Boximator 可以通過文本精準控制生成視頻中人物或物體的動作。
例如,下雨天,大風把一位女生的雨傘吹走了。目前,很少有視頻模型能精準做到這一點。左側為 Boximator 生成的視頻
論文地址:
https://arxiv.org/abs/2402.01566
項目地址:
https://boximator.github.io/Boximator 案例賞析我們先看一下 Boximator 與 Gen-2、Pink1.0,在使用相同的文本提示詞、圖像生成的視頻,所表現出來的不同動作。
為了方便觀察,「AIGC 開放社區」將對比視頻整合在一起,最左邊的是 Boximator 生成的視頻。
一個可愛的 3D 男孩站著,然后走路在這個案例中,Pika 1.0 生成的視頻男孩只是站著沒有走動,Gen-2 的視頻走動了但不明顯,只有 Boximator 產生了明顯的走動動作。
一位英俊的男人用他的右手從口袋里拿出一朵玫瑰
聯系作者
文章來源:AI前線
作者微信:ai-front
作者簡介:面向AI愛好者、開發者和科學家,提供AI領域技術資訊、一線業界實踐案例、搜羅整理業界技術分享干貨、AI論文解讀。每周一節技術分享公開課,助力你全面擁抱人工智能技術。
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...