開(kāi)箱黑盒LLM！谷歌大一統(tǒng)框架Patchscopes實(shí)戰(zhàn)教程來(lái)了

AIGC動(dòng)態(tài)1年前 (2024)發(fā)布新智元

AIGC動(dòng)態(tài)歡迎閱讀

原標(biāo)題：開(kāi)箱黑盒LLM！谷歌大一統(tǒng)框架Patchscopes實(shí)戰(zhàn)教程來(lái)了
關(guān)鍵字：模型,表征,提示,單詞,目標(biāo)
文章來(lái)源：新智元
內(nèi)容字?jǐn)?shù)：12260字

內(nèi)容摘要：

新智元報(bào)道編輯：LRS
【新智元導(dǎo)讀】大模型最為人詬病的問(wèn)題就是不透明、不可解釋。谷歌的最新框架Patchscopes可以提供關(guān)于模型內(nèi)部隱藏表征的自然語(yǔ)言解釋，本文介紹了一些實(shí)戰(zhàn)應(yīng)用樣例。雖然大型語(yǔ)言模型（LLM）在各種常見(jiàn)的自然語(yǔ)言處理任務(wù)中展現(xiàn)出了優(yōu)異的性能，但隨之而來(lái)的幻覺(jué)，也揭示了模型在真實(shí)性和透明度上仍然存在問(wèn)題。
在模型生成錯(cuò)誤回復(fù)內(nèi)容時(shí)，如果能夠「深入理解其背后運(yùn)行機(jī)制」，或許可以解決模型的幻覺(jué)問(wèn)題。
然而，隨著深度神經(jīng)網(wǎng)絡(luò)的復(fù)雜性和規(guī)模的增長(zhǎng)，模型的「可解釋研究」也越來(lái)越有挑戰(zhàn)性，通過(guò)探索機(jī)器學(xué)習(xí)（ML）模型對(duì)所學(xué)內(nèi)容（模型的所謂隱藏表示）進(jìn)行表征的方式，即隱藏表征（hidden representation），研究人員可以在一定程度上控制模型的行為，并對(duì)模型的實(shí)際運(yùn)行方式進(jìn)行更深入的科學(xué)理解。
從過(guò)去的研究結(jié)果來(lái)看，一個(gè)相對(duì)有前景的方向是「使用LLMs來(lái)解釋其他模型的神經(jīng)元模式」（neuron patterns）。
今年1月，Google Research和特拉維夫大學(xué)的研究人員共同提出了一個(gè)統(tǒng)一的框架Patchscopes來(lái)研究LLMs中的隱藏表征，主要思路就是

原文鏈接：開(kāi)箱黑盒LLM！谷歌大一統(tǒng)框架Patchscopes實(shí)戰(zhàn)教程來(lái)了

聯(lián)系作者

文章來(lái)源：新智元
作者微信：AI_era
作者簡(jiǎn)介：智能+中國(guó)主平臺(tái)，致力于推動(dòng)中國(guó)從互聯(lián)網(wǎng)+邁向智能+新紀(jì)元。重點(diǎn)關(guān)注人工智能、機(jī)器人等前沿領(lǐng)域發(fā)展，關(guān)注人機(jī)融合、人工智能和機(jī)器人對(duì)人類社會(huì)與文明進(jìn)化的影響，領(lǐng)航中國(guó)新智能時(shí)代。

閱讀原文