<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        圖像領(lǐng)域與LLM的完美碰撞:西湖大學(xué)揭示圖像鏈CoT的創(chuàng)新強(qiáng)化微調(diào)之路

        AIGC動(dòng)態(tài)9個(gè)月前發(fā)布 新智元
        444 0 0

        圖像領(lǐng)域與LLM的完美碰撞:西湖大學(xué)揭示圖像鏈CoT的創(chuàng)新強(qiáng)化微調(diào)之路

        原標(biāo)題:圖像領(lǐng)域再次與LLM一拍即合!idea撞車OpenAI強(qiáng)化微調(diào),西湖大學(xué)發(fā)布圖像鏈CoT
        文章來源:新智元
        內(nèi)容字?jǐn)?shù):5880字

        引言

        本文總結(jié)了MAPLE實(shí)驗(yàn)室提出的一種通過強(qiáng)化學(xué)習(xí)優(yōu)化圖像生成模型去噪過程的方法。該方法旨在以更少的步驟生成高質(zhì)量圖像,并在多個(gè)圖像生成模型中實(shí)現(xiàn)了顯著的推理步驟減少和圖像質(zhì)量提升。

        研究背景

        當(dāng)前,擴(kuò)散模型和流匹配模型是主流的圖像生成技術(shù)。這些模型通過逐步去噪將從高斯噪聲中采樣的信號(hào)轉(zhuǎn)變?yōu)楦哔|(zhì)量圖像。然而,傳統(tǒng)的去噪過程面臨兩個(gè)問題:一是無法保證最終圖像符合人類偏好,二是對(duì)不同復(fù)雜度的圖像采用相同的去噪策略。MAPLE實(shí)驗(yàn)室發(fā)現(xiàn),通過強(qiáng)化學(xué)習(xí)微調(diào),可以使模型自適應(yīng)地調(diào)整推理過程中的噪聲強(qiáng)度,從而以更少的步驟生成高質(zhì)量的圖像。

        方法概述

        MAPLE實(shí)驗(yàn)室將圖像生成過程視為類似于大語言模型(LLM)的思維鏈(CoT)。在模型推理過程中,利用時(shí)間預(yù)測模塊(TPM)動(dòng)態(tài)預(yù)測下一步去噪所需的擴(kuò)散時(shí)間。通過引入強(qiáng)化微調(diào)技術(shù),模型能夠在每一步中根據(jù)獎(jiǎng)勵(lì)模型評(píng)估圖像質(zhì)量,以確保生成過程符合人類偏好。

        強(qiáng)化微調(diào)訓(xùn)練

        在訓(xùn)練過程中,模型使用Beta分布對(duì)擴(kuò)散時(shí)間進(jìn)行采樣,并通過獎(jiǎng)勵(lì)函數(shù)綜合考慮生成圖像的質(zhì)量和去噪步數(shù)。研究顯示,經(jīng)過強(qiáng)化微調(diào)的模型在保持圖像質(zhì)量的同時(shí),平均減少約50%的生成步數(shù)。強(qiáng)化微調(diào)不僅提高了模型的生成效率,還顯著改善了生成圖像的自然度。

        實(shí)驗(yàn)結(jié)果

        在對(duì)Stable Diffusion 3、Flux-dev等先進(jìn)開源圖像生成模型進(jìn)行強(qiáng)化微調(diào)訓(xùn)練后,實(shí)驗(yàn)結(jié)果表明,經(jīng)過強(qiáng)化微調(diào)的模型普遍減少了推理步數(shù),同時(shí)圖像質(zhì)量保持穩(wěn)定。這一結(jié)果驗(yàn)證了強(qiáng)化微調(diào)作為一種通用的后訓(xùn)練方法在圖像生成領(lǐng)域的有效性。

        結(jié)論

        MAPLE實(shí)驗(yàn)室的研究展示了通過強(qiáng)化學(xué)習(xí)優(yōu)化多步去噪圖像生成過程的潛力。強(qiáng)化微調(diào)技術(shù)不僅顯著減少了推理步驟,還提升了生成圖像的質(zhì)量,表明該方法在圖像生成模型中的應(yīng)用與提升仍有廣闊的前景。


        聯(lián)系作者

        文章來源:新智元
        作者微信:
        作者簡介:智能+中國主平臺(tái),致力于推動(dòng)中國從互聯(lián)網(wǎng)+邁向智能+新紀(jì)元。重點(diǎn)關(guān)注人工智能、機(jī)器人等前沿領(lǐng)域發(fā)展,關(guān)注人機(jī)融合、人工智能和機(jī)器人對(duì)人類社會(huì)與文明進(jìn)化的影響,領(lǐng)航中國新智能時(shí)代。

        閱讀原文
        ? 版權(quán)聲明
        蟬鏡AI數(shù)字人

        相關(guān)文章

        蟬鏡AI數(shù)字人

        暫無評(píng)論

        暫無評(píng)論...
        主站蜘蛛池模板: 免费一级一片一毛片| 日日操夜夜操免费视频| 亚洲色无码专区在线观看| 一区二区免费在线观看| 亚洲免费一区二区| 一本色道久久综合亚洲精品高清 | 国产A∨免费精品视频| 亚洲精品成人网久久久久久| 日本久久久久亚洲中字幕| 久操视频免费观看| 亚洲精品在线免费观看| 999久久久免费精品国产| 亚洲av无码一区二区三区观看| 在线观看亚洲免费| 亚洲日本va午夜中文字幕久久| 好吊色永久免费视频大全| 亚洲av无码乱码国产精品| xxxxwww免费| mm1313亚洲国产精品无码试看| 亚洲人成电影网站国产精品| 国产真人无码作爱视频免费| 亚洲精品免费视频| 成人免费午夜视频| 一区二区三区免费视频观看| 亚洲天堂一区二区| 美女被免费视频网站a国产| 国产l精品国产亚洲区在线观看| 9420免费高清在线视频| 精品丝袜国产自在线拍亚洲| **俄罗斯毛片免费| 亚洲综合精品成人| 国产亚洲精品不卡在线| 7723日本高清完整版免费| 免费一级全黄少妇性色生活片| 国产精品免费_区二区三区观看| 国产福利免费视频| 亚洲日本乱码卡2卡3卡新区| 在线看免费观看AV深夜影院| 亚洲av成本人无码网站| 亚洲av无码精品网站| 免费激情视频网站|