MAGREF

MAGREF – 字節跳動推出的多主體視頻生成框架

MAGREF

MAGREF是字節跳動推出的一款多主體視頻生成框架，僅需一張參考圖像和文本提示，即可生成高質量、主體一致的視頻，支持單人、多人及復雜交互場景。它基于創新的區域感知動態掩碼和像素級通道拼接機制，能夠精準復刻身份特征，確保視頻中人物、物體與背景的和諧統一。

MAGREF：視頻創作的革新者

MAGREF（Masked Guidance for Any?Reference Video Generation）是字節跳動傾力打造的多主體視頻生成框架，它正在改變視頻創作的格局。這款強大的工具僅需一張參考圖像和一段文本提示，就能生成令人驚嘆的高質量視頻。無論是單人表演、多人互動，還是人物與物體、背景的復雜交互，MAGREF都能輕松應對。

核心功能：釋放無限創作潛能

多主體視頻生成：輕松駕馭單人、多人互動，以及人物與物體、背景的復雜場景。人物身份高度一致，多人同框再也不會出現“串臉”的尷尬。
高度一致性與可控性：基于一張參考圖像和文本提示，生成身份穩定、動作自然的視頻，同時支持對人物動作、表情、環境和光影效果的精細控制。
復雜場景處理：輕松處理人物與物體交互（如人與寵物互動、人物操作物體）及人物置于復雜背景中（如城市街景、自然環境等）的場景，生成語義清晰、風格協調的視頻。
高效與通用：無需為不同任務單獨設計模型，MAGREF基于最小架構改動和統一訓練流程，就能完美適配多種參考圖配置，實現效率與靈活性的完美結合。