字節跳動推出顛覆性文生視頻模型，可控制動作！

AIGC動態2年前 (2024)發布 AI前線

字節跳動推出顛覆性文生視頻模型，可自由控制動作！

AIGC動態歡迎閱讀

原標題：字節跳動推出顛覆性文生視頻模型，可控制動作！
關鍵字：字節跳動,視頻,解讀,侵權,模型
文章來源：AI前線
內容字數：3688字

內容摘要：

來源｜AIGC開放社區
在 Sora 引爆文生視頻賽道之前，國內的字節跳動也推出了一款顛覆性視頻模型——Boximator。
與 Gen-2、Pink1.0 等模型不同的是，Boximator 可以通過文本精準控制生成視頻中人物或物體的動作。
例如，下雨天，大風把一位女生的雨傘吹走了。目前，很少有視頻模型能精準做到這一點。左側為 Boximator 生成的視頻
論文地址：
https://arxiv.org/abs/2402.01566
項目地址：
https://boximator.github.io/Boximator 案例賞析我們先看一下 Boximator 與 Gen-2、Pink1.0，在使用相同的文本提示詞、圖像生成的視頻，所表現出來的不同動作。
為了方便觀察，「AIGC 開放社區」將對比視頻整合在一起，最左邊的是 Boximator 生成的視頻。
一個可愛的 3D 男孩站著，然后走路在這個案例中，Pika 1.0 生成的視頻男孩只是站著沒有走動，Gen-2 的視頻走動了但不明顯，只有 Boximator 產生了明顯的走動動作。
一位英俊的男人用他的右手從口袋里拿出一朵玫瑰

原文鏈接：字節跳動推出顛覆性文生視頻模型，可控制動作！