生成式模型不只會「模仿」！哈佛、UCSB等最新成果：性能可超越訓練集專家水平

AIGC動態歡迎閱讀

原標題：生成式模型不只會「模仿」！哈佛、UCSB等最新成果：性能可超越訓練集專家水平
關鍵字：專家,模型,概率,低溫,數據
文章來源：新智元
內容字數：0字

內容摘要：

新智元報道編輯：LRS
【新智元導讀】生成式模型原本被設計來模仿人類的各種復雜行為，但人們普遍認為它們最多只能達到與其訓練數據中的專家相當的水平。不過，最新的研究突破了這一限制，表明在特定領域，如國際象棋，通過采用低溫采樣技術，這些模型能夠超越它們所學習的那些專家，展現出更高的能力。生成式模型（GMs）的設計宗旨是模仿人類的各種行為，例如回答問題、創作藝術、唱歌等，人類在這些領域都展現出高超的技能。
然而，模型在訓練過程中實際上只專注于一個核心目標，即最小化模型輸出的交叉熵損失，確保模型的輸出分布盡可能地接近人類標注的分布。
換句話說，模型的能力上限可能已經被定死了，最多只能達到人類專家在其專業領域的表現水平。
但最近來自哈佛大學、加州大學圣巴巴拉分校（UCSB）、普林斯頓大學的研究結果表明，模型在某些特定的領域可以實現「超越（transcend）訓練數據中的專家水平」的性能，青出于藍而勝于藍。論文鏈接：https://arxiv.org/pdf/2406.11741
研究人員選擇國際象棋作為研究目標展現模型的超越性（transcendence），因為其規則和玩法是清晰且有限的。
然

原文鏈接：生成式模型不只會「模仿」！哈佛、UCSB等最新成果：性能可超越訓練集專家水平