AIGC動態歡迎閱讀
原標題:Ilya參與,OpenAI給GPT-4搞可解釋,提取了1600萬個特征,還能看它怎么想
關鍵字:模型,編碼器,特征,人工智能,神經網絡
文章來源:機器之心
內容字數:0字
內容摘要:
機器之心報道
編輯:小舟、澤南、大盤雞大模型也可解釋了?
大模型都在想什么?OpenAI 找到了一種辦法,能給 GPT-4 做「掃描」,告訴你 AI 的思路,而且還把這種方法開源了。大語言模型(LLM)是當前 AI 領域最熱門的探索方向,吸引了大量的關注和研究投入。它們強大的語言理解能力和生成能力在各種應用場景中都表現出巨大潛力。雖然我們見證了大模型迭代后性能上的顯著提升,但我們目前對模型中的神經活動仍然只是一知半解。
本周四,OpenAI 分享了一種查找大量「特征」的全新方法 —— 或許這會成為可解釋的一種可用方向。OpenAI 表示,新方法比此前的一些思路更具可擴展性,研究團隊使用它們在 GPT-4 中找到了 1600 萬個特征。
有趣的是,從作者列表中,我們發現已經從 OpenAI 離職的 Ilya Sutskever、Jan Leike 等人也是作者之一。可謂是一項重要的研究。
論文標題:Scaling and evaluating sparse autoencoders
論文地址:https://cdn.openai.com/papers/sparse-autoencoder
原文鏈接:Ilya參與,OpenAI給GPT-4搞可解釋,提取了1600萬個特征,還能看它怎么想
聯系作者
文章來源:機器之心
作者微信:almosthuman2014
作者簡介:專業的人工智能媒體和產業服務平臺
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章

暫無評論...