国产精品亚洲mnbav网站_成人午夜亚洲精品无码网站_日韩va亚洲va欧洲va国产_亚洲欧洲精品成人久久曰影片

圖像生成告別AI味!清華、港中大、騰訊混元聯手推出SRPO新方法,美觀、逼真、藝術感都有了

AIGC動態2個月前更新 算泥
9 0 0
圖像生成告別AI味!清華、港中大、騰訊混元聯手推出SRPO新方法,美觀、逼真、藝術感都有了

導讀: 算泥社區,一個集AI大模型開發服務、算法與算力于一體的開源生態,正以前沿技術驅動AI創作邊界。文本到圖像生成領域,在DALL-E、Midjourney、Stable Diffusion等模型的推動下,已達百花齊放之境。然而,如何讓AI生成的圖像擺脫“AI味”,真正貼近人類的審美偏好,一直是行業難題。騰訊混元團隊聯合香港中文大學(深圳)及清華大學深圳國際研究生院的專家,重磅推出“語義相對偏好優化”(SRPO)技術,顯著提升了AI生成圖像的審美、真實感與藝術感,并將訓練時間大幅縮短至十分鐘。這項突破性進展,解決了AI審美學習的計算成本高昂、獎勵模型離線調試繁瑣兩大痛點。

圖像生成告別AI味!清華、港中大、騰訊混元聯手推出SRPO新方法,美觀、逼真、藝術感都有了

AI圖像生成的審美困境

近年來,文本到圖像生成技術取得了飛躍式發展。從最初的DALL-E,到如今百花齊放的模型,AI已經能夠根據文本描述創造出令人驚嘆的視覺作品。然而,這些成果往往在技術上達到了“正確”,卻難以觸及人類內心深處的“美”。生成的圖像常常帶有明顯的“AI痕跡”,缺乏人類所追求的自然、逼真與藝術韻味。究其原因,人類的審美標準復雜且主觀,如何將這種“玄學”般的偏好量化并注入AI模型,一直是研究者們面臨的巨大挑戰。傳統的強化學習方法,通過引入“審美裁判”(獎勵模型)來指導AI學習,即AI創作一張圖,裁判打分,好則獎勵,差則懲罰。但這種方式存在兩大頑疾:一是“獎勵黑客”現象,AI為了追求高分,可能鉆評分漏洞,生成表面上分數高但質量低劣的圖像,例如偏愛某種顏色或細節極簡的“光滑”圖像;二是優化范圍受限,強化學習通常只能在生成過程的末端進行微調,對于早期階段的生成軌跡難以干預,這進一步加劇了獎勵黑客問題。此外,現有的獎勵模型往往基于有限的數據和過時的模型訓練,其“審美”判斷帶有固有偏見,難以適應當前生成模型日新月異的發展和日益挑剔的用戶需求,往往需要昂貴的離線微調才能勉強勝任。

Direct-Align:加速AI圖像生成的“傳送門”

面對上述挑戰,騰訊混元團隊與合作者們并未退縮,而是選擇正面突破。他們首先推出的法寶是Direct-Align。其核心理念堪稱點睛之筆:摒棄繁瑣的回溯式計算,直接構建一個“傳送門”,允許從生成過程中的任何時間點一步到位地恢復出最終的清晰圖像。這一創新源于擴散模型的一個內在數學特性——在任意噪聲水平\(t\)下,帶噪聲圖像\(x_t\)實際上是原始清晰圖像\(x_0\)與高斯噪聲\(\epsilon_{gt}\)的線性組合。Direct-Align正是基于此洞察,不再依賴多步迭代采樣,而是通過引入真實的噪聲先驗,利用封閉形式的解析解,瞬間完成圖像的恢復。這一技術徹底規避了迭代采樣可能導致的梯度等優化不穩定性問題,使得優化過程極為穩健。更重要的是,Direct-Align能夠從生成軌跡的任何階段進行優化,即使是在噪聲極大的早期階段,也能精準恢復圖像,這意味著可以在整個生成過程中進行優化,而非僅限于最后幾個步驟。為了進一步增強優化穩定性,Direct-Align還引入了一個獎勵聚合框架。它從一張清晰圖像\(x_0\)出發,生成一系列不同噪聲程度的中間狀態,對每個狀態進行“一步恢復”并計算獎勵得分。隨后,這些得分通過帶有衰減折扣因子的方式進行聚合,最后統一進行梯度更新。關鍵的折扣因子能夠賦予早期階段獎勵更高的權重,有效遏制模型在后期階段為了追求分數而產生的“獎勵黑客”行為。

圖像生成告別AI味!清華、港中大、騰訊混元聯手推出SRPO新方法,美觀、逼真、藝術感都有了

Direct-Align的卓越之處體現在:它實現了在生成過程早期進行優化,這在以往是難以想象的;它擺脫了多步采樣的束縛,極大地提升了計算效率;其優化過程極其穩定,有效避免了梯度;通過全局優化和獎勵聚合,它顯著緩解了獎勵黑客問題。可以說,Direct-Align成功地消除了“計算成本高昂”和“優化范圍狹窄”這兩座橫亙在AI圖像生成道路上的大山。

SRPO:AI的“高級審美”調校大師

在Direct-Align奠定的堅實基礎上,真正的王牌——語義相對偏好優化(SRPO)——橫空出世。若Direct-Align解決了“效率”與“范圍”的問題,那么SRPO則直擊“審美”與“控制”這兩個終極難題。其核心創新在于,將抽象的“獎勵信號”轉化為可通過文本精確控制的“偏好信號”。這意味著,用戶可以實時、動態地向AI傳達自己的意圖,而無需依賴昂貴的離線獎勵模型訓練。SRPO的架構看似簡潔,實則巧妙地融合了Direct-Align與獎勵模型。它運用“語義引導偏好”(Semantic Guided Preference)和“語義相對偏好”(Semantic-Relative Preference)兩大機制,實現了對AI審美的精細化。研究團隊發現,文本提示(prompt)是可以縱的。通過在原始提示前添加特定的“控制詞”,例如“一張逼真的照片”,就能夠巧妙地引導獎勵模型的評分偏好。這如同向裁判發出指令:“今天我們側重‘真實感’的評估標準”,裁判便會心領神會地調整其評分邏輯。這一發現具有劃時代的意義,它表明可以通過簡單的文本操作,轉移獎勵的偏好,實現可控的審美引導。然而,僅僅引導還不足以完全解決獎勵模型的固有偏見。例如,即使引導關注“真實感”,如果獎勵模型本身偏愛紅色,它仍可能傾向于給帶有紅色的“真實”照片打高分。為應對此挑戰,“語義相對偏好”機制應運而生。以往的方法可能通過引入多個具有不同偏見的獎勵模型來尋求折衷,但這往往只能獲得平庸的結果。SRPO則另辟蹊徑,它洞察到獎勵模型的偏見主要源于其圖像編碼器。因此,它創造性地提出:使用同一個獎勵模型,針對同一張圖像,生成一對“正向”和“反向”的獎勵信號。具體實現方式是通過提示增強。例如,輸入一個“正向”提示“一張逼真的照片”,和一個“負向”提示“一張卡通畫”,讓獎勵模型對同一張圖進行兩次評分。在優化過程中,模型會努力靠近“逼真”的特征,同時主動規避“卡通”的特征。在這個過程中,兩個信號中都存在的獎勵模型的一般性偏見(如對紅色的偏愛)會因為一正一負而被抵消,而我們真正期望的語義差異(逼真與卡通)則被保留并放大。這種操作堪稱天才之舉!

更有趣的是,借助Direct-Align的雙向優化能力,SRPO還實現了一種名為“基于反轉的正則化”的創新玩法。在去噪(正向)過程中,模型執行梯度上升,學習好的偏好;而在加噪(反向)過程中,則執行梯度下降,懲罰壞的偏好。通過在不同時間步解耦獎勵項和懲罰項,SRPO進一步增強了優化的魯棒性,使得獎勵黑客無處遁形。SRPO的優勢是顛覆性的:它實現了在線獎勵調整,用戶只需修改提示詞即可指揮AI,告別了繁瑣的微調;通過正負樣本對比,從根本上緩解了獎勵黑客問題;能夠實現對畫面風格、質感的精細化控制。最關鍵的是,它繼承了Direct-Align的高效率,以極低的成本完成了這一重大突破。

性能實測:數據與人眼的雙重認可

為了驗證SRPO的強大能力,研究團隊在FLUX.1.dev這一頂級的開源文生圖模型上進行了嚴格的性能測試。他們選用行業公認的HPSv2.1作為獎勵模型,并在人類偏好數據集HPDv2上進行訓練,隨后與ReFL、DRaFT-LV、DanceGRPO等主流在線強化學習方法進行了全方位的對比。評估維度兼顧了自動化指標和人類主觀評價。在自動化評估方面,SRPO在美學分數(Aesthetic Score)和PickScore上均位列第一。尤為驚人的是其訓練效率,僅需5.3個GPU小時(約等于10分鐘),而效果相當的DanceGRPO卻需要480個GPU小時,效率提升了近90倍。人類評估的結果更是令人矚目。在逼真度、美學和總體偏好方面,SRPO實現了斷層式的領先。其逼真度“優秀”率從基線模型的8.2%飆升至38.9%,提升了近五倍;美學“優秀”率從9.8%提升至40.5%;整體偏好“優秀”率則從5.3%提升至29.4%。這意味著,在未增加額外訓練數據的情況下,SRPO系統性、大幅度地提升了大規模擴散模型的逼真度,堪稱前所未有。

圖像生成告別AI味!清華、港中大、騰訊混元聯手推出SRPO新方法,美觀、逼真、藝術感都有了

團隊還進行了深入的詳細分析,例如在不同獎勵模型(CLIP、PickScore、HPSv2.1)下的表現,發現SRPO的增強效果具有普適性,無論在何種評價標準下都能穩定發揮。他們還證明了在生成過程早期進行優化對于避免獎勵黑客至關重要,僅在后期優化時,被“黑”的概率會顯著增加。最令人興奮的是其精細化的控制能力。通過簡單的“控制詞”,SRPO就能讓模型在“明亮”、“暗黑”、“油畫”、“漫畫”、“賽博朋克”等多種風格之間自如切換。實驗結果表明,在獎勵模型訓練數據現頻率較高的詞匯,如“油畫”,控制效果尤為顯著。對于一些較少見的風格,如“文藝復興”,雖然效果稍弱,但通過組合提示(如“文藝復興風格的油畫”)也能獲得改善。這為未來個性化、定制化圖像生成開辟了廣闊的想象空間。

圖像生成告別AI味!清華、港中大、騰訊混元聯手推出SRPO新方法,美觀、逼真、藝術感都有了圖像生成告別AI味!清華、港中大、騰訊混元聯手推出SRPO新方法,美觀、逼真、藝術感都有了圖像生成告別AI味!清華、港中大、騰訊混元聯手推出SRPO新方法,美觀、逼真、藝術感都有了圖像生成告別AI味!清華、港中大、騰訊混元聯手推出SRPO新方法,美觀、逼真、藝術感都有了圖像生成告別AI味!清華、港中大、騰訊混元聯手推出SRPO新方法,美觀、逼真、藝術感都有了

盡管SRPO已展現出驚人的實力,研究團隊仍謙虛地指出了其局限性,例如對某些冷門風格的控制力仍有待加強,以及內部工作機制的可解釋性尚需進一步深入研究。SRPO方法的出現,憑借其極致的效率和卓越的質量,將AI從單純的“模仿者”轉變為能夠理解并執行人類復雜審美需求的“藝術家”。

閱讀原文
? 版權聲明
蟬鏡AI數字人

相關文章

蟬鏡AI數字人

暫無評論

暫無評論...
国产精品亚洲mnbav网站_成人午夜亚洲精品无码网站_日韩va亚洲va欧洲va国产_亚洲欧洲精品成人久久曰影片
<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        欧美色区777第一页| 91在线精品一区二区三区| 国产成人午夜视频| 久久久午夜精品理论片中文字幕| 美女免费视频一区二区| 精品成人佐山爱一区二区| 国产精品自在在线| 亚洲另类春色国产| 日韩视频免费直播| 成人18视频日本| 天天综合网天天综合色 | 老司机精品视频导航| 欧美一卡二卡在线| 国产成人综合在线观看| 亚洲精品免费播放| 欧美一级欧美一级在线播放| 国产一区二区看久久| 亚洲欧美日韩国产成人精品影院| 欧美日韩激情一区二区三区| 国产尤物一区二区| 亚洲v精品v日韩v欧美v专区| 久久久精品免费观看| 91精彩视频在线观看| 国内外成人在线| 亚洲资源在线观看| 国产精品污污网站在线观看| 欧美在线影院一区二区| 国产99久久精品| 麻豆91精品视频| 亚洲国产精品人人做人人爽| 国产欧美日韩综合| 精品欧美一区二区三区精品久久| 在线视频你懂得一区| 国v精品久久久网| 精品一区二区三区免费毛片爱| 一区二区三区免费网站| 国产精品天美传媒| 久久蜜桃av一区二区天堂| 欧美精选在线播放| 欧美亚洲尤物久久| 91丝袜美女网| 成人国产免费视频| 一区二区三区精品在线观看| 国产精品人成在线观看免费| 久久亚洲免费视频| 精品久久久久久久久久久久久久久久久 | 欧美mv和日韩mv国产网站| 在线观看视频91| 色综合网站在线| 91社区在线播放| www..com久久爱| 成人av在线观| 波多野结衣精品在线| www.亚洲激情.com| 成熟亚洲日本毛茸茸凸凹| 高清av一区二区| 懂色av中文字幕一区二区三区| 国产乱码精品一区二区三区av| 麻豆国产精品777777在线| 毛片不卡一区二区| 另类成人小视频在线| 久久爱www久久做| 激情五月激情综合网| 国产一区二区在线观看免费| 国产一区二区三区香蕉| 粉嫩绯色av一区二区在线观看| 国产精品乡下勾搭老头1| 国产成人精品午夜视频免费| 国产xxx精品视频大全| 95精品视频在线| 欧美日韩综合色| 日韩精品一区二区三区在线观看| 精品国产精品网麻豆系列 | 日韩和欧美一区二区| 日日摸夜夜添夜夜添亚洲女人| 日本欧美在线看| 国产精品白丝jk白祙喷水网站 | 精品美女一区二区三区| 2021中文字幕一区亚洲| 日本一区二区三区电影| 亚洲天堂av老司机| 日本亚洲电影天堂| 丁香桃色午夜亚洲一区二区三区| 99久久久无码国产精品| 777奇米四色成人影色区| 2023国产精华国产精品| 亚洲色图欧美偷拍| 美腿丝袜亚洲三区| 91丨porny丨在线| 日韩午夜激情视频| 亚洲欧美另类小说视频| 裸体一区二区三区| 一本色道久久综合亚洲91| 91精品国产色综合久久不卡电影 | 蜜臀a∨国产成人精品| 成人av电影在线| 日韩免费电影网站| 一区二区三区成人在线视频| 国内精品视频666| 欧美在线免费视屏| 国产精品久久久久久久裸模| 日本网站在线观看一区二区三区| 丁香五精品蜜臀久久久久99网站| 欧美日韩国产经典色站一区二区三区| 久久久久九九视频| 全部av―极品视觉盛宴亚洲| 色综合久久99| 国产午夜久久久久| 九九九久久久精品| 欧美日韩一区二区三区免费看| 国产精品五月天| 韩国av一区二区| 欧美一区二区三区在线观看视频| 亚洲欧美偷拍另类a∨色屁股| 韩国女主播一区| 欧美一区二区三区在线| 亚洲一区二区四区蜜桃| www.日韩精品| 国产精品丝袜黑色高跟| 国产露脸91国语对白| 日韩欧美123| 日本视频一区二区| 制服丝袜成人动漫| 午夜一区二区三区视频| 91麻豆成人久久精品二区三区| 国产偷国产偷精品高清尤物| 久久66热偷产精品| 精品国产髙清在线看国产毛片| 天堂va蜜桃一区二区三区| 日本道色综合久久| 一区二区三区四区五区视频在线观看| 99久久综合狠狠综合久久| 中文字幕av一区二区三区高| 大桥未久av一区二区三区中文| 久久久九九九九| 国产精品亚洲一区二区三区妖精 | 国产精品一卡二| 久久综合99re88久久爱| 国产宾馆实践打屁股91| 国产精品久久久久久久浪潮网站| 成人av综合在线| 一区二区三区在线影院| 欧美日韩视频专区在线播放| 亚洲成人精品一区| 日韩一区二区精品在线观看| 麻豆精品一区二区三区| 精品久久久久久亚洲综合网| 国产精品123| 一区二区三区欧美在线观看| 在线播放日韩导航| 国产剧情一区二区三区| 国产精品二三区| 精品婷婷伊人一区三区三| 青青草精品视频| 久久精品一区二区三区不卡 | 亚洲国产精品天堂| 日韩欧美的一区| av电影在线观看不卡| 一区二区理论电影在线观看| 欧美日韩一级片在线观看| 免费看欧美女人艹b| 国产精品色呦呦| 欧美无人高清视频在线观看| 欧美aaa在线| 国产精品久久久久影视| 欧美日韩黄视频| 狠狠狠色丁香婷婷综合激情| www国产精品av| 色综合久久精品| 免费av成人在线| 中文字幕在线免费不卡| 91麻豆精品国产综合久久久久久| 国产九色sp调教91| 亚洲国产cao| 国产婷婷色一区二区三区在线| 一本大道久久a久久综合| 老司机精品视频导航| 亚洲欧美电影一区二区| 日韩三级高清在线| 色哦色哦哦色天天综合| 国产一区久久久| 亚洲成人在线网站| 国产精品国产三级国产普通话99| 91精品国产一区二区三区| 成人免费毛片片v| 久久99九九99精品| 三级精品在线观看| 亚洲精品日日夜夜| 日本一区二区不卡视频| 日韩欧美国产一区二区三区| 色婷婷精品大在线视频| 成人少妇影院yyyy| 国产成人av电影在线观看| 美女高潮久久久| 琪琪久久久久日韩精品| 午夜欧美在线一二页| 一区二区三区精密机械公司| 亚洲欧美激情在线| 国产精品乱人伦一区二区| 国产欧美日韩精品一区|