USO – 字節(jié)跳動(dòng)推出的AI繪畫模型
USO:融合風(fēng)格與主體的AI繪畫新范式
USO(Unified Style-Subject Optimized)是字節(jié)跳動(dòng)UXO團(tuán)隊(duì)推出的革新性AI繪畫模型,它能夠?qū)崿F(xiàn)任意主題、任意風(fēng)格、任意場(chǎng)景的組合,生成具有高度主體一致性、強(qiáng)烈風(fēng)格保真度且自然不失真感的圖像。USO的核心價(jià)值在于其創(chuàng)新的協(xié)同解耦范式,打破了風(fēng)格與主體生成任務(wù)的壁壘,通過(guò)大規(guī)模三元組數(shù)據(jù)集、解耦學(xué)習(xí)方案以及風(fēng)格獎(jiǎng)勵(lì)學(xué)習(xí)(SRL)等技術(shù),成功構(gòu)建了一個(gè)強(qiáng)大的統(tǒng)一生成模型,并在USO-Bench這一首個(gè)聯(lián)合評(píng)估基準(zhǔn)上展現(xiàn)了頂尖的性能。
USO的獨(dú)特之處
USO模型的問(wèn)世,標(biāo)志著AI繪畫在風(fēng)格與主體融合領(lǐng)域取得了重大突破。它不再是簡(jiǎn)單地將風(fēng)格“套用”到主體上,而是實(shí)現(xiàn)了深度融合。這意味著你可以輕松地將一個(gè)熟悉的角色,以截然不同的藝術(shù)風(fēng)格呈現(xiàn),例如,將寫實(shí)風(fēng)格的游戲角色瞬間轉(zhuǎn)化為水墨畫風(fēng)格,而角色的辨識(shí)度和核心特征將得到完美保留。這種能力極大地拓寬了藝術(shù)創(chuàng)作、廣告設(shè)計(jì)、游戲開發(fā)等領(lǐng)域的想象空間。
技術(shù)革新引領(lǐng)行業(yè)前沿
USO的強(qiáng)大能力源于其先進(jìn)的技術(shù)原理。首先,它構(gòu)建了海量的三元組數(shù)據(jù)集,為模型提供了豐富的學(xué)習(xí)素材。其次,其核心的解耦學(xué)習(xí)方案,通過(guò)兩個(gè)關(guān)鍵階段——風(fēng)格對(duì)齊訓(xùn)練和內(nèi)容-風(fēng)格解耦訓(xùn)練,巧妙地分離了內(nèi)容與風(fēng)格信息,避免了特征的相互干擾,從而實(shí)現(xiàn)了精準(zhǔn)的融合。此外,引入的風(fēng)格獎(jiǎng)勵(lì)學(xué)習(xí)(SRL)進(jìn)一步優(yōu)化了生成質(zhì)量,在保持主體一致性的同時(shí),精準(zhǔn)地捕捉并還原了目標(biāo)風(fēng)格的精髓。更值得一提的是,USO將風(fēng)格驅(qū)動(dòng)和主體驅(qū)動(dòng)兩類任務(wù)整合進(jìn)一個(gè)統(tǒng)一的框架,解決了傳統(tǒng)方法中兩者相互制約的難題,實(shí)現(xiàn)了協(xié)同優(yōu)化。
性能卓越,應(yīng)用廣泛
在實(shí)際的模型效果上,USO表現(xiàn)出了驚人的精準(zhǔn)度和高質(zhì)量。它能夠精準(zhǔn)地遷移風(fēng)格,同時(shí)鎖定主體特征,適配多種風(fēng)格,生成自然逼真的圖像。在USO-Bench基準(zhǔn)測(cè)試中,USO在主體一致性和風(fēng)格相似性兩項(xiàng)關(guān)鍵指標(biāo)上均超越了現(xiàn)有所有開源SOTA模型。其強(qiáng)大的聯(lián)合生成能力,使其能夠滿足風(fēng)格與主體的雙重需求,一步到位生成完美融合的圖像。
USO的應(yīng)用場(chǎng)景極為廣泛,從藝術(shù)家的靈感激發(fā)到廣告設(shè)計(jì)的創(chuàng)意呈現(xiàn),從游戲開發(fā)的角色風(fēng)格轉(zhuǎn)換到影視制作的視覺效果預(yù)覽,再到教育領(lǐng)域的教學(xué)輔助,USO都展現(xiàn)出了巨大的潛力,為各行各業(yè)的創(chuàng)新提供了強(qiáng)大的技術(shù)支撐。
項(xiàng)目鏈接
- 項(xiàng)目官網(wǎng):https://bytedance.github.io/USO/
- Github倉(cāng)庫(kù):https://github.com/bytedance/USO
- arXiv技術(shù)論文:https://arxiv.org/pdf/2508.18966

粵公網(wǎng)安備 44011502001135號(hào)