OpenAI最強(qiáng)競(jìng)品訓(xùn)練AI拆解LLM黑箱,意外窺見(jiàn)大模型「靈魂」
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:OpenAI最強(qiáng)競(jìng)品訓(xùn)練AI拆解LLM黑箱,意外窺見(jiàn)大模型「靈魂」
關(guān)鍵字:神經(jīng)元,特征,報(bào)告,解釋性,模型
文章來(lái)源:新智元
內(nèi)容字?jǐn)?shù):4932字
內(nèi)容摘要:新智元報(bào)道編輯:潤(rùn)【新智元導(dǎo)讀】Anthropic的模型可解釋性團(tuán)隊(duì),從大模型中看到了它的「靈魂」——一個(gè)可解釋的更高級(jí)的模型。為了拆開(kāi)大模型的「黑箱」,Anthropic可解釋性團(tuán)隊(duì)發(fā)表了一篇論文,講述了他們通過(guò)訓(xùn)練一個(gè)新的模型去理解一個(gè)簡(jiǎn)單的模型的方法。Anthropic發(fā)表的一項(xiàng)研究聲稱能夠看到了人工智能的靈魂。它看起來(lái)像這樣:論文地址:https://transformer-circuits.pub/2023/monosemantic-features/index.html#phenomenology-fsa在研究者看來(lái),這個(gè)新的模型能準(zhǔn)確地預(yù)測(cè)和理解原本模型中神經(jīng)元的工作原理和組成機(jī)制。Anthropic的可解釋性團(tuán)隊(duì)最近宣布他們成功分解了一個(gè)模擬AI系統(tǒng)中的抽象高維特征空間。創(chuàng)建一個(gè)可解釋的AI去理解「AI黑盒」研究人員首先訓(xùn)練了一個(gè)非常簡(jiǎn)單的512神經(jīng)元AI來(lái)預(yù)測(cè)文本,然后訓(xùn)…
原文鏈接:點(diǎn)此閱讀原文:OpenAI最強(qiáng)競(jìng)品訓(xùn)練AI拆解LLM黑箱,意外窺見(jiàn)大模型「靈魂」
聯(lián)系作者
文章來(lái)源:新智元
作者微信:AI_era
作者簡(jiǎn)介:智能+中國(guó)主平臺(tái),致力于推動(dòng)中國(guó)從互聯(lián)網(wǎng)+邁向智能+新紀(jì)元。重點(diǎn)關(guān)注人工智能、機(jī)器人等前沿領(lǐng)域發(fā)展,關(guān)注人機(jī)融合、人工智能和機(jī)器人對(duì)人類社會(huì)與文明進(jìn)化的影響,領(lǐng)航中國(guó)新智能時(shí)代。