USO – 字節跳動推出的AI繪畫模型
USO:融合風格與主體的AI繪畫新范式
USO(Unified Style-Subject Optimized)是字節跳動UXO團隊推出的革新性AI繪畫模型,它能夠實現任意主題、任意風格、任意場景的組合,生成具有高度主體一致性、強烈風格保真度且自然不失真感的圖像。USO的核心價值在于其創新的協同解耦范式,打破了風格與主體生成任務的壁壘,通過大規模三元組數據集、解耦學習方案以及風格獎勵學習(SRL)等技術,成功構建了一個強大的統一生成模型,并在USO-Bench這一首個聯合評估基準上展現了頂尖的性能。
USO的獨特之處
USO模型的問世,標志著AI繪畫在風格與主體融合領域取得了重大突破。它不再是簡單地將風格“套用”到主體上,而是實現了深度融合。這意味著你可以輕松地將一個熟悉的角色,以截然不同的藝術風格呈現,例如,將寫實風格的游戲角色瞬間轉化為水墨畫風格,而角色的辨識度和核心特征將得到完美保留。這種能力極大地拓寬了藝術創作、廣告設計、游戲開發等領域的想象空間。
技術革新引領行業前沿
USO的強大能力源于其先進的技術原理。首先,它構建了海量的三元組數據集,為模型提供了豐富的學習素材。其次,其核心的解耦學習方案,通過兩個關鍵階段——風格對齊訓練和內容-風格解耦訓練,巧妙地分離了內容與風格信息,避免了特征的相互干擾,從而實現了精準的融合。此外,引入的風格獎勵學習(SRL)進一步優化了生成質量,在保持主體一致性的同時,精準地捕捉并還原了目標風格的精髓。更值得一提的是,USO將風格驅動和主體驅動兩類任務整合進一個統一的框架,解決了傳統方法中兩者相互制約的難題,實現了協同優化。
性能卓越,應用廣泛
在實際的模型效果上,USO表現出了驚人的精準度和高質量。它能夠精準地遷移風格,同時鎖定主體特征,適配多種風格,生成自然逼真的圖像。在USO-Bench基準測試中,USO在主體一致性和風格相似性兩項關鍵指標上均超越了現有所有開源SOTA模型。其強大的聯合生成能力,使其能夠滿足風格與主體的雙重需求,一步到位生成完美融合的圖像。
USO的應用場景極為廣泛,從藝術家的靈感激發到廣告設計的創意呈現,從游戲開發的角色風格轉換到影視制作的視覺效果預覽,再到教育領域的教學輔助,USO都展現出了巨大的潛力,為各行各業的創新提供了強大的技術支撐。
項目鏈接
- 項目官網:https://bytedance.github.io/USO/
- Github倉庫:https://github.com/bytedance/USO
- arXiv技術論文:https://arxiv.org/pdf/2508.18966