他們掰開神經(jīng)元,終于讓大模型9.8大于9.11了:神秘創(chuàng)業(yè)公司,開源AI「」工具

AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:他們掰開神經(jīng)元,終于讓大模型9.8大于9.11了:神秘創(chuàng)業(yè)公司,開源AI「」工具
關(guān)鍵字:神經(jīng)元,模型,報(bào)告,系統(tǒng),用戶
文章來源:機(jī)器之心
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
機(jī)器之心報(bào)道
機(jī)器之心編輯部大模型為什么認(rèn)為 9.8<9.11?神經(jīng)元級別的解釋來了。9.8 和 9.11 到底哪個(gè)大?這個(gè)小學(xué)生都能答對的問題卻難倒了一眾大模型,很多模型輸出的結(jié)果都是「9.8<9.11」。為什么模型會(huì)集體出錯(cuò)?AI 研究者們總結(jié)了很多可能的原因,比如模型會(huì)把 9.11 拆解成 9/./11 三部分,然后拿 11 去和 8 作比較;也有人猜測,大模型會(huì)把 9.8 和 9.11 當(dāng)成日期或版本號……
這些解釋聽起來都有些道理,但如果我們能夠直觀地「看到」模型出錯(cuò)的原因,那么我們對于問題的歸因會(huì)更加準(zhǔn)確,解決問題的速度也會(huì)更快。
剛剛官宣的 AI 研究實(shí)驗(yàn)室 Transluce(字面意思是讓光線穿過某物以揭示其結(jié)構(gòu)) 就在做這件事情。他們開發(fā)了一個(gè)名叫 Monitor 的交互界面,以幫助人類觀察、理解和引導(dǎo)語言模型的內(nèi)部計(jì)算。
透過 Monitor,我們先來看看 AI 模型為什么會(huì)覺得 9.11 比 9.8 更大。
首先,讓模型比較一下這兩個(gè)數(shù)的大小,當(dāng)然它沒有意外地出錯(cuò)了。Monitor 提供了快捷的方式幫助我們分析其錯(cuò)誤。將光標(biāo)放在出錯(cuò)的位置,可以看到模型在此處預(yù)測的
原文鏈接:他們掰開神經(jīng)元,終于讓大模型9.8大于9.11了:神秘創(chuàng)業(yè)公司,開源AI「」工具
聯(lián)系作者
文章來源:機(jī)器之心
作者微信:
作者簡介:

粵公網(wǎng)安備 44011502001135號