国产精品亚洲mnbav网站_成人午夜亚洲精品无码网站_日韩va亚洲va欧洲va国产_亚洲欧洲精品成人久久曰影片

圖像生成告別AI味!清華、港中大、騰訊混元聯手推出SRPO新方法,美觀、逼真、藝術感都有了

AIGC動態2個月前更新 算泥
9 0 0
圖像生成告別AI味!清華、港中大、騰訊混元聯手推出SRPO新方法,美觀、逼真、藝術感都有了

導讀: 算泥社區,一個集AI大模型開發服務、算法與算力于一體的開源生態,正以前沿技術驅動AI創作邊界。文本到圖像生成領域,在DALL-E、Midjourney、Stable Diffusion等模型的推動下,已達百花齊放之境。然而,如何讓AI生成的圖像擺脫“AI味”,真正貼近人類的審美偏好,一直是行業難題。騰訊混元團隊聯合香港中文大學(深圳)及清華大學深圳國際研究生院的專家,重磅推出“語義相對偏好優化”(SRPO)技術,顯著提升了AI生成圖像的審美、真實感與藝術感,并將訓練時間大幅縮短至十分鐘。這項突破性進展,解決了AI審美學習的計算成本高昂、獎勵模型離線調試繁瑣兩大痛點。

圖像生成告別AI味!清華、港中大、騰訊混元聯手推出SRPO新方法,美觀、逼真、藝術感都有了

AI圖像生成的審美困境

近年來,文本到圖像生成技術取得了飛躍式發展。從最初的DALL-E,到如今百花齊放的模型,AI已經能夠根據文本描述創造出令人驚嘆的視覺作品。然而,這些成果往往在技術上達到了“正確”,卻難以觸及人類內心深處的“美”。生成的圖像常常帶有明顯的“AI痕跡”,缺乏人類所追求的自然、逼真與藝術韻味。究其原因,人類的審美標準復雜且主觀,如何將這種“玄學”般的偏好量化并注入AI模型,一直是研究者們面臨的巨大挑戰。傳統的強化學習方法,通過引入“審美裁判”(獎勵模型)來指導AI學習,即AI創作一張圖,裁判打分,好則獎勵,差則懲罰。但這種方式存在兩大頑疾:一是“獎勵黑客”現象,AI為了追求高分,可能鉆評分漏洞,生成表面上分數高但質量低劣的圖像,例如偏愛某種顏色或細節極簡的“光滑”圖像;二是優化范圍受限,強化學習通常只能在生成過程的末端進行微調,對于早期階段的生成軌跡難以干預,這進一步加劇了獎勵黑客問題。此外,現有的獎勵模型往往基于有限的數據和過時的模型訓練,其“審美”判斷帶有固有偏見,難以適應當前生成模型日新月異的發展和日益挑剔的用戶需求,往往需要昂貴的離線微調才能勉強勝任。

Direct-Align:加速AI圖像生成的“傳送門”

面對上述挑戰,騰訊混元團隊與合作者們并未退縮,而是選擇正面突破。他們首先推出的法寶是Direct-Align。其核心理念堪稱點睛之筆:摒棄繁瑣的回溯式計算,直接構建一個“傳送門”,允許從生成過程中的任何時間點一步到位地恢復出最終的清晰圖像。這一創新源于擴散模型的一個內在數學特性——在任意噪聲水平\(t\)下,帶噪聲圖像\(x_t\)實際上是原始清晰圖像\(x_0\)與高斯噪聲\(\epsilon_{gt}\)的線性組合。Direct-Align正是基于此洞察,不再依賴多步迭代采樣,而是通過引入真實的噪聲先驗,利用封閉形式的解析解,瞬間完成圖像的恢復。這一技術徹底規避了迭代采樣可能導致的梯度等優化不穩定性問題,使得優化過程極為穩健。更重要的是,Direct-Align能夠從生成軌跡的任何階段進行優化,即使是在噪聲極大的早期階段,也能精準恢復圖像,這意味著可以在整個生成過程中進行優化,而非僅限于最后幾個步驟。為了進一步增強優化穩定性,Direct-Align還引入了一個獎勵聚合框架。它從一張清晰圖像\(x_0\)出發,生成一系列不同噪聲程度的中間狀態,對每個狀態進行“一步恢復”并計算獎勵得分。隨后,這些得分通過帶有衰減折扣因子的方式進行聚合,最后統一進行梯度更新。關鍵的折扣因子能夠賦予早期階段獎勵更高的權重,有效遏制模型在后期階段為了追求分數而產生的“獎勵黑客”行為。

圖像生成告別AI味!清華、港中大、騰訊混元聯手推出SRPO新方法,美觀、逼真、藝術感都有了

Direct-Align的卓越之處體現在:它實現了在生成過程早期進行優化,這在以往是難以想象的;它擺脫了多步采樣的束縛,極大地提升了計算效率;其優化過程極其穩定,有效避免了梯度;通過全局優化和獎勵聚合,它顯著緩解了獎勵黑客問題。可以說,Direct-Align成功地消除了“計算成本高昂”和“優化范圍狹窄”這兩座橫亙在AI圖像生成道路上的大山。

SRPO:AI的“高級審美”調校大師

在Direct-Align奠定的堅實基礎上,真正的王牌——語義相對偏好優化(SRPO)——橫空出世。若Direct-Align解決了“效率”與“范圍”的問題,那么SRPO則直擊“審美”與“控制”這兩個終極難題。其核心創新在于,將抽象的“獎勵信號”轉化為可通過文本精確控制的“偏好信號”。這意味著,用戶可以實時、動態地向AI傳達自己的意圖,而無需依賴昂貴的離線獎勵模型訓練。SRPO的架構看似簡潔,實則巧妙地融合了Direct-Align與獎勵模型。它運用“語義引導偏好”(Semantic Guided Preference)和“語義相對偏好”(Semantic-Relative Preference)兩大機制,實現了對AI審美的精細化。研究團隊發現,文本提示(prompt)是可以縱的。通過在原始提示前添加特定的“控制詞”,例如“一張逼真的照片”,就能夠巧妙地引導獎勵模型的評分偏好。這如同向裁判發出指令:“今天我們側重‘真實感’的評估標準”,裁判便會心領神會地調整其評分邏輯。這一發現具有劃時代的意義,它表明可以通過簡單的文本操作,轉移獎勵的偏好,實現可控的審美引導。然而,僅僅引導還不足以完全解決獎勵模型的固有偏見。例如,即使引導關注“真實感”,如果獎勵模型本身偏愛紅色,它仍可能傾向于給帶有紅色的“真實”照片打高分。為應對此挑戰,“語義相對偏好”機制應運而生。以往的方法可能通過引入多個具有不同偏見的獎勵模型來尋求折衷,但這往往只能獲得平庸的結果。SRPO則另辟蹊徑,它洞察到獎勵模型的偏見主要源于其圖像編碼器。因此,它創造性地提出:使用同一個獎勵模型,針對同一張圖像,生成一對“正向”和“反向”的獎勵信號。具體實現方式是通過提示增強。例如,輸入一個“正向”提示“一張逼真的照片”,和一個“負向”提示“一張卡通畫”,讓獎勵模型對同一張圖進行兩次評分。在優化過程中,模型會努力靠近“逼真”的特征,同時主動規避“卡通”的特征。在這個過程中,兩個信號中都存在的獎勵模型的一般性偏見(如對紅色的偏愛)會因為一正一負而被抵消,而我們真正期望的語義差異(逼真與卡通)則被保留并放大。這種操作堪稱天才之舉!

更有趣的是,借助Direct-Align的雙向優化能力,SRPO還實現了一種名為“基于反轉的正則化”的創新玩法。在去噪(正向)過程中,模型執行梯度上升,學習好的偏好;而在加噪(反向)過程中,則執行梯度下降,懲罰壞的偏好。通過在不同時間步解耦獎勵項和懲罰項,SRPO進一步增強了優化的魯棒性,使得獎勵黑客無處遁形。SRPO的優勢是顛覆性的:它實現了在線獎勵調整,用戶只需修改提示詞即可指揮AI,告別了繁瑣的微調;通過正負樣本對比,從根本上緩解了獎勵黑客問題;能夠實現對畫面風格、質感的精細化控制。最關鍵的是,它繼承了Direct-Align的高效率,以極低的成本完成了這一重大突破。

性能實測:數據與人眼的雙重認可

為了驗證SRPO的強大能力,研究團隊在FLUX.1.dev這一頂級的開源文生圖模型上進行了嚴格的性能測試。他們選用行業公認的HPSv2.1作為獎勵模型,并在人類偏好數據集HPDv2上進行訓練,隨后與ReFL、DRaFT-LV、DanceGRPO等主流在線強化學習方法進行了全方位的對比。評估維度兼顧了自動化指標和人類主觀評價。在自動化評估方面,SRPO在美學分數(Aesthetic Score)和PickScore上均位列第一。尤為驚人的是其訓練效率,僅需5.3個GPU小時(約等于10分鐘),而效果相當的DanceGRPO卻需要480個GPU小時,效率提升了近90倍。人類評估的結果更是令人矚目。在逼真度、美學和總體偏好方面,SRPO實現了斷層式的領先。其逼真度“優秀”率從基線模型的8.2%飆升至38.9%,提升了近五倍;美學“優秀”率從9.8%提升至40.5%;整體偏好“優秀”率則從5.3%提升至29.4%。這意味著,在未增加額外訓練數據的情況下,SRPO系統性、大幅度地提升了大規模擴散模型的逼真度,堪稱前所未有。

圖像生成告別AI味!清華、港中大、騰訊混元聯手推出SRPO新方法,美觀、逼真、藝術感都有了

團隊還進行了深入的詳細分析,例如在不同獎勵模型(CLIP、PickScore、HPSv2.1)下的表現,發現SRPO的增強效果具有普適性,無論在何種評價標準下都能穩定發揮。他們還證明了在生成過程早期進行優化對于避免獎勵黑客至關重要,僅在后期優化時,被“黑”的概率會顯著增加。最令人興奮的是其精細化的控制能力。通過簡單的“控制詞”,SRPO就能讓模型在“明亮”、“暗黑”、“油畫”、“漫畫”、“賽博朋克”等多種風格之間自如切換。實驗結果表明,在獎勵模型訓練數據現頻率較高的詞匯,如“油畫”,控制效果尤為顯著。對于一些較少見的風格,如“文藝復興”,雖然效果稍弱,但通過組合提示(如“文藝復興風格的油畫”)也能獲得改善。這為未來個性化、定制化圖像生成開辟了廣闊的想象空間。

圖像生成告別AI味!清華、港中大、騰訊混元聯手推出SRPO新方法,美觀、逼真、藝術感都有了圖像生成告別AI味!清華、港中大、騰訊混元聯手推出SRPO新方法,美觀、逼真、藝術感都有了圖像生成告別AI味!清華、港中大、騰訊混元聯手推出SRPO新方法,美觀、逼真、藝術感都有了圖像生成告別AI味!清華、港中大、騰訊混元聯手推出SRPO新方法,美觀、逼真、藝術感都有了圖像生成告別AI味!清華、港中大、騰訊混元聯手推出SRPO新方法,美觀、逼真、藝術感都有了

盡管SRPO已展現出驚人的實力,研究團隊仍謙虛地指出了其局限性,例如對某些冷門風格的控制力仍有待加強,以及內部工作機制的可解釋性尚需進一步深入研究。SRPO方法的出現,憑借其極致的效率和卓越的質量,將AI從單純的“模仿者”轉變為能夠理解并執行人類復雜審美需求的“藝術家”。

閱讀原文
? 版權聲明
蟬鏡AI數字人

相關文章

蟬鏡AI數字人

暫無評論

暫無評論...
国产精品亚洲mnbav网站_成人午夜亚洲精品无码网站_日韩va亚洲va欧洲va国产_亚洲欧洲精品成人久久曰影片
<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        日韩毛片视频在线看| 亚洲男人电影天堂| 亚洲欧洲色图综合| 91麻豆高清视频| 伊人婷婷欧美激情| 日韩欧美中文字幕公布| 国产精品综合一区二区三区| 亚洲人一二三区| 91精品麻豆日日躁夜夜躁| 国产精品亚洲一区二区三区妖精 | 日韩欧美一二三区| 国产精品18久久久久久久网站| 国产精品久久免费看| 色综合久久综合中文综合网| 婷婷丁香久久五月婷婷| 久久久精品一品道一区| 欧美日韩激情在线| 粗大黑人巨茎大战欧美成人| 香蕉成人伊视频在线观看| 欧美极品少妇xxxxⅹ高跟鞋| 欧美日韩精品欧美日韩精品一 | 一区二区在线观看免费视频播放| 欧美日本精品一区二区三区| 粉嫩绯色av一区二区在线观看| 亚洲动漫第一页| 中文字幕在线观看一区| 欧美mv和日韩mv的网站| 欧美日韩美少妇| 91麻豆成人久久精品二区三区| 九九九精品视频| 天天综合天天综合色| 一区二区在线免费| 欧美国产精品中文字幕| 精品日韩av一区二区| 欧美日韩在线播放三区四区| 成人黄色电影在线| 国产在线观看免费一区| 秋霞国产午夜精品免费视频| 亚洲在线中文字幕| 亚洲啪啪综合av一区二区三区| 日韩精品一区二区三区蜜臀| 欧美日韩激情在线| 在线观看日产精品| 色8久久人人97超碰香蕉987| 成人免费视频app| 国产黑丝在线一区二区三区| 精品一区二区三区在线播放视频| 日日夜夜一区二区| 性久久久久久久| 丝袜美腿一区二区三区| 午夜影院久久久| 日韩福利视频网| 麻豆一区二区99久久久久| 蜜桃视频在线观看一区| 免费一级片91| 国产一区二区三区精品欧美日韩一区二区三区 | 偷拍日韩校园综合在线| 亚洲一区二区三区中文字幕在线| 亚洲男人天堂一区| 一区二区欧美国产| 亚洲.国产.中文慕字在线| 日韩高清不卡一区| 激情综合一区二区三区| 国产黄色精品网站| 91影院在线免费观看| 日本乱人伦一区| 欧美日韩国产大片| 欧美一区二区视频观看视频| 日韩欧美一二三| 亚洲国产精品t66y| 一区二区在线免费| 久久爱另类一区二区小说| 国产毛片精品视频| 91亚洲精品久久久蜜桃| 欧美在线观看视频一区二区三区| 欧美情侣在线播放| 久久久久国产精品麻豆ai换脸 | 久久久久久久久久久电影| 久久九九久精品国产免费直播| 国产调教视频一区| 亚洲欧美另类小说| 日本美女视频一区二区| 丰满白嫩尤物一区二区| 欧洲亚洲国产日韩| 26uuu欧美| 一级日本不卡的影视| 蜜臀久久99精品久久久画质超高清| 国产一二三精品| 欧美在线你懂得| 久久日韩精品一区二区五区| 亚洲欧美一区二区三区极速播放| 亚洲午夜影视影院在线观看| 狠狠色狠狠色合久久伊人| 色综合久久天天| 精品成人一区二区三区| 一区二区三区欧美视频| 国产九九视频一区二区三区| 精品视频资源站| 国产精品欧美精品| 久久精品国产99国产| 在线亚洲一区二区| 国产视频一区在线观看| 日韩av电影天堂| 欧洲一区二区三区免费视频| 国产三级精品视频| 美女一区二区久久| 精品视频一区 二区 三区| 亚洲图片另类小说| 国产成人av一区二区三区在线| 欧美另类videos死尸| 亚洲天堂中文字幕| 懂色av一区二区夜夜嗨| 日韩欧美亚洲国产另类| 日韩—二三区免费观看av| 欧美亚洲动漫制服丝袜| 亚洲美女免费视频| 91在线观看下载| 欧美国产精品久久| 国产suv精品一区二区三区| 精品久久人人做人人爰| 日本欧美一区二区| 日韩一区二区三区在线视频| 日本欧美久久久久免费播放网| 欧美日韩一区二区在线观看视频| 亚洲欧美在线aaa| 97久久精品人人做人人爽| 国产精品久久久久久久久晋中| 国产精品一区二区视频| 久久只精品国产| 国产精品羞羞答答xxdd| 国产午夜精品一区二区| 粉嫩av亚洲一区二区图片| 欧美高清在线精品一区| 国产成人在线视频网站| 国产精品素人视频| 99久久99久久综合| 一区二区三区四区不卡视频| 欧美日韩亚州综合| 天天色综合天天| 精品久久国产老人久久综合| 国产综合色精品一区二区三区| 久久亚洲一级片| 国产麻豆9l精品三级站| 国产精品久久毛片a| 在线免费观看日韩欧美| 午夜激情综合网| 亚洲精品一区二区三区精华液 | 91在线播放网址| 亚洲精品欧美激情| 欧美精品在线观看播放| 精品一区二区三区视频在线观看 | 欧美不卡一二三| 福利一区福利二区| 一区二区三区高清不卡| 91精品国产综合久久精品app| 看国产成人h片视频| 欧美国产1区2区| 欧美在线观看18| 激情欧美一区二区三区在线观看| 国产精品免费看片| 欧美系列一区二区| 国产精品白丝av| 亚洲国产精品自拍| 久久久精品免费观看| 欧美亚洲禁片免费| 国产91综合网| 日韩电影在线免费看| 中文字幕中文字幕一区| 91精品国产综合久久久久久漫画 | 蜜芽一区二区三区| 一区精品在线播放| 久久五月婷婷丁香社区| 欧美四级电影在线观看| 国产福利一区在线观看| 婷婷久久综合九色综合绿巨人| 久久久www成人免费毛片麻豆| 在线精品国精品国产尤物884a| 国产在线一区观看| 亚洲成人高清在线| 一区二区三区在线观看欧美| 久久免费午夜影院| 欧美一区二区网站| 欧美日韩中文字幕精品| 成人av在线看| 国产高清一区日本| 国产在线视频精品一区| 日本不卡在线视频| 亚洲自拍另类综合| 亚洲男人的天堂在线观看| 国产女主播一区| 久久久另类综合| 久久影院午夜论| 亚洲精品在线观| 精品久久久久久久久久久久久久久| 欧美日韩在线综合| 欧美三级日韩三级| 欧美日韩免费高清一区色橹橹| 色婷婷精品大在线视频| 99久久精品国产一区二区三区 | 久久福利视频一区二区|