AIGC動態歡迎閱讀
原標題:OpenAI公開GPT-4思維的新方法,Ilya也參與了!
關鍵字:編碼器,模型,團隊,損失,特征
文章來源:量子位
內容字數:0字
內容摘要:
西風 發自 凹非寺量子位 | 公眾號 QbitAIOpenAI研究如何GPT-4思維,公開超級對齊團隊工作,Ilya Sutskever也在作者名單之列。
該研究提出了改進大規模訓練稀疏自編碼器的方法,并成功將GPT-4的內部表征解構為1600萬個可理解的特征。
由此,復雜語言模型的內部工作變得更加可理解。
其實,早在6個月前,研究就已經開始進行了:
OpenAI將其公開后,前超級對齊團隊成員、論文一作前來轉發分享:
我們引入了一種基于TopK激活函數的新稀疏自編碼器訓練技術棧,消除了特征縮減問題,并允許直接設置L0。
我們發現這種方法在均方誤差/L0邊界上表現良好。即使在1600萬的規模下,也幾乎沒有失活的潛在單元(latent)。
同樣在坐著名單里的、此前在OpenAI超級對齊團隊的Ilya同盟Jan Leike(就是從OpenAI憤而離職剛剛加入Anthropic的RLHF發明者之一)也表示:
這是一項重大的進步!稀疏自編碼器是目前用來真正理解模型內部思維的最好的方法。
更有意思的是,不久前Anthropic發了一項類似的工作。
成功從Claude 3.0 Sonnet的中間
原文鏈接:OpenAI公開GPT-4思維的新方法,Ilya也參與了!
聯系作者
文章來源:量子位
作者微信:QbitAI
作者簡介:追蹤人工智能新趨勢,關注科技行業新突破
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...