他們掰開神經(jīng)元，終于讓大模型9.8大于9.11了：神秘創(chuàng)業(yè)公司，開源AI「」工具

AIGC動(dòng)態(tài)1年前 (2024)發(fā)布機(jī)器之心

他們掰開神經(jīng)元，終于讓大模型9.8大于9.11了：神秘創(chuàng)業(yè)公司，開源AI「洗腦」工具

AIGC動(dòng)態(tài)歡迎閱讀

原標(biāo)題：他們掰開神經(jīng)元，終于讓大模型9.8大于9.11了：神秘創(chuàng)業(yè)公司，開源AI「」工具
關(guān)鍵字：神經(jīng)元,模型,報(bào)告,系統(tǒng),用戶
文章來源：機(jī)器之心
內(nèi)容字?jǐn)?shù)：0字

內(nèi)容摘要：

機(jī)器之心報(bào)道
機(jī)器之心編輯部大模型為什么認(rèn)為 9.8<9.11？神經(jīng)元級別的解釋來了。9.8 和 9.11 到底哪個(gè)大？這個(gè)小學(xué)生都能答對的問題卻難倒了一眾大模型，很多模型輸出的結(jié)果都是「9.8<9.11」。為什么模型會(huì)集體出錯(cuò)？AI 研究者們總結(jié)了很多可能的原因，比如模型會(huì)把 9.11 拆解成 9/./11 三部分，然后拿 11 去和 8 作比較；也有人猜測，大模型會(huì)把 9.8 和 9.11 當(dāng)成日期或版本號……
這些解釋聽起來都有些道理，但如果我們能夠直觀地「看到」模型出錯(cuò)的原因，那么我們對于問題的歸因會(huì)更加準(zhǔn)確，解決問題的速度也會(huì)更快。
剛剛官宣的 AI 研究實(shí)驗(yàn)室 Transluce（字面意思是讓光線穿過某物以揭示其結(jié)構(gòu)）就在做這件事情。他們開發(fā)了一個(gè)名叫 Monitor 的交互界面，以幫助人類觀察、理解和引導(dǎo)語言模型的內(nèi)部計(jì)算。
透過 Monitor，我們先來看看 AI 模型為什么會(huì)覺得 9.11 比 9.8 更大。
首先，讓模型比較一下這兩個(gè)數(shù)的大小，當(dāng)然它沒有意外地出錯(cuò)了。Monitor 提供了快捷的方式幫助我們分析其錯(cuò)誤。將光標(biāo)放在出錯(cuò)的位置，可以看到模型在此處預(yù)測的

原文鏈接：他們掰開神經(jīng)元，終于讓大模型9.8大于9.11了：神秘創(chuàng)業(yè)公司，開源AI「」工具