<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        推理時也能做偏好優(yōu)化,無需額外重訓練,來自上海AI Lab港中文等

        AIGC動態(tài)7個月前發(fā)布 量子位
        491 0 0

        增強模型在多樣化場景中的適應能?

        推理時也能做偏好優(yōu)化,無需額外重訓練,來自上海AI Lab港中文等

        原標題:推理時也能做偏好優(yōu)化,無需額外重訓練,來自上海AI Lab港中文等
        文章來源:量子位
        內容字數(shù):5822字

        推理時偏好優(yōu)化(TPO):一種無需重新訓練的對齊大語言模型的新方法

        隨著大語言模型(LLMs)的快速發(fā)展,如何確保其輸出既符合預期又安全成為關鍵挑戰(zhàn)。傳統(tǒng)的偏好對齊方法,例如基于人類反饋的強化學習(RLHF)和直接偏好優(yōu)化(DPO),需要在訓練過程中更新模型參數(shù),靈活性不足。為了解決這一問題,上海人工智能實驗室、香港中文大學等機構聯(lián)合提出了一種名為推理時偏好優(yōu)化(TPO)的新方法。

        1. TPO的核心思想

        TPO的核心在于將模型對齊過程從訓練階段轉移到推理階段。它通過在推理階段與獎勵模型交互,利用可解釋的文本反饋迭代優(yōu)化模型輸出,從而實現(xiàn)即時模型對齊,而無需重新訓練模型參數(shù)。這使得TPO能夠靈活適應不斷變化的數(shù)據(jù)和需求。

        2. TPO的優(yōu)勢

        TPO具有以下幾個顯著優(yōu)勢:

        1. 推理時對齊,無需訓練:TPO在推理階段與獎勵模型交互,無需更新模型參數(shù),節(jié)省了大量的計算資源和時間。
        2. 基于文本反饋:TPO使用可解釋的文本反饋,而非純數(shù)值梯度,讓模型能夠“理解”并“執(zhí)行”文本評價,提高了對齊的透明度。
        3. 優(yōu)于傳統(tǒng)方法:實驗結果表明,TPO能夠有效提升未對齊模型的表現(xiàn),甚至超越經過訓練的對齊模型。
        4. 靈活適應性:TPO能夠靈活應對不斷變化的數(shù)據(jù)和需求,具有較強的適應性,并在資源有限的環(huán)境下高效運行。

        3. TPO的工作機制

        TPO借鑒了標準梯度優(yōu)化方法的思路,包含四個關鍵組件:變量定義、損失計算、梯度計算和變量優(yōu)化。它使用獎勵模型作為人類偏好的代理,提供生成回復質量的反饋。通過迭代調整輸出,逐步使其更符合獎勵模型的偏好。具體過程包括:初始化、文本損失函數(shù)定義、文本梯度計算和迭代優(yōu)化四個步驟。TPO通過將獎勵模型的信號轉化為“文本損失”和“文本梯度”,指導模型生成更符合預期的回復。

        4. 實驗結果與分析

        研究人員在多個基準測試中評估了TPO的性能。結果表明,TPO顯著提升了未對齊模型Llama-3.1-70B-SFT的性能,使其達到了與已對齊模型Llama-3.1-70B-Instruct相當甚至更好的水平。同時,TPO也進一步增強了已對齊模型的性能。此外,TPO還展現(xiàn)出良好的推理穩(wěn)定性和計算效率。

        5. 結論與未來展望

        TPO提供了一種輕量、高效且可解釋的大語言模型偏好對齊方案。它無需重新訓練,即可實現(xiàn)模型與人類偏好的對齊,并具有良好的靈活性和適應性。未來研究可以集中在優(yōu)化文本交互方法、探索更魯棒的獎勵模型以及提升較弱模型在TPO中的表現(xiàn)等方向。


        聯(lián)系作者

        文章來源:量子位
        作者微信:
        作者簡介:追蹤人工智能新趨勢,關注科技行業(yè)新突破

        閱讀原文
        ? 版權聲明
        蟬鏡AI數(shù)字人

        相關文章

        蟬鏡AI數(shù)字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 全部免费毛片在线| 免费观看激色视频网站bd| 午夜高清免费在线观看| 四虎永久在线精品免费网址| 亚洲黄色在线播放| 国产精品亚洲精品爽爽| 日韩免费毛片视频| 久久久久亚洲精品无码蜜桃| 日韩免费在线视频| 久久亚洲伊人中字综合精品| 99国产精品免费视频观看| 亚洲精品免费在线| 大陆一级毛片免费视频观看| 激情无码亚洲一区二区三区| 国产精彩免费视频| 亚洲熟妇无码八AV在线播放 | 亚洲一卡2卡三卡4卡无卡下载| 在线看片无码永久免费视频| 亚洲AV无码日韩AV无码导航| 特级一级毛片免费看| 国产亚洲精品国看不卡| 亚洲精品无码国产片| yy6080久久亚洲精品| 中国内地毛片免费高清| 国产一精品一aⅴ一免费| 皇色在线免费视频| 久久亚洲精品无码aⅴ大香| 成年女人午夜毛片免费看| 亚洲熟妇av一区二区三区下载| 美女被cao免费看在线看网站| 亚洲国产精品不卡在线电影| 69式互添免费视频| 国产成人亚洲综合无| 亚洲男人的天堂www| 久久久久久国产a免费观看黄色大片| 久久亚洲精品无码网站| 亚洲大尺度无码专区尤物| 18禁无遮挡无码网站免费| 久久久久久av无码免费看大片| 亚洲国产成人精品无码一区二区| 免费大学生国产在线观看p|