<label id="3dn8r"><mark id="3dn8r"></mark></label>

<span id="3dn8r"></span>

<span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

<code id="uccks"></code>

<rt id="uccks"><delect id="uccks"></delect></rt>

<nav id="uccks"><dl id="uccks"></dl></nav>

<button id="uccks"><input id="uccks"></input></button>

<center id="uccks"><acronym id="uccks"></acronym></center>

<dl id="uccks"><acronym id="uccks"></acronym></dl>

LLM為何頻頻翻車算術題？最新研究追蹤單個神經元，「大腦短路」才是根源

AIGC動態9個月前發布新智元

514 0 0

LLM為何頻頻翻車算術題？最新研究追蹤單個神經元，「大腦短路」才是根源

AIGC動態歡迎閱讀

原標題：LLM為何頻頻翻車算術題？最新研究追蹤單個神經元，「大腦短路」才是根源
關鍵字：神經元,模型,算術,啟發式,算法
文章來源：新智元
內容字數：0字

內容摘要：

新智元報道編輯：peter東喬楊
【新智元導讀】大模型在數學問題上的表現不佳，原因在于采取啟發式算法進行數算的，通過定位到多層感知機（MLP）中的單個神經元，可以對進行數算的具體過程進行解釋。由于缺少對運行邏輯的解釋，大模型一向被人稱為「黑箱」，但近來的不少研究已能夠在單個神經元層面上解釋大模型的運行機制。
例如Claude在2023年發表的一項研究，將大模型中大約500個神經元分解成約4000個可解釋特征。
而10月28日的一項研究，以算術推理作為典型任務，借鑒類似的研究方法，確定了大模型中的一個模型子集，能解釋模型大部分的基本算術邏輯行為。
論文地址：https://arxiv.org/abs/2410.21272
該研究首先定位了Llama3-8B/70B, Pythia-6.9B及GPT-J四個模型中負責算術計算的模型子集。
如圖1所示，少數注意力頭對大模型面對算術問題的正確率有顯著影響。第一個 MLP（多層感知機）明顯影響操作數和操作符位置，而中間層和后期層的 MLP 將token信息投影到最后位置，提升正確答案的出現概率。
圖1：Llama3-8B中發現算術相

原文鏈接：LLM為何頻頻翻車算術題？最新研究追蹤單個神經元，「大腦短路」才是根源

聯系作者

文章來源：新智元
作者微信：
作者簡介：

# AIGC動態 # 啟發式 # 模型 # 神經元 # 算術 # 算法

? 版權聲明

文章版權歸作者所有，未經允許請勿轉載。

蟬鏡AI數字人

相關文章

蟬鏡AI數字人

暫無評論

暫無評論...

主站蜘蛛池模板：久久免费高清视频| 国产美女精品久久久久久久免费| 国产高清不卡免费视频| 久久久久久久91精品免费观看| 国产成人啪精品视频免费网| 亚洲色www永久网站| 亚洲av午夜国产精品无码中文字| 精品无码一级毛片免费视频观看| 免费看黄视频网站| 亚洲一区在线免费观看| 抽搐一进一出gif免费视频| 成人免费毛片视频| 国精无码欧精品亚洲一区| 亚洲经典千人经典日产| 1000部夫妻午夜免费 | 成年轻人网站色免费看| 亚洲国产精品免费观看| 久久午夜免费鲁丝片| 亚洲黄色三级网站| 花蝴蝶免费视频在线观看高清版| 国产精品成人四虎免费视频| 污污免费在线观看| 国产精品高清全国免费观看| 九九综合VA免费看| 午夜国产大片免费观看| 亚洲中文字幕日本无线码| 免费无码成人AV在线播放不卡| 亚洲精品国产成人影院| 亚洲AV女人18毛片水真多| 亚洲精品老司机在线观看| 国产午夜精品久久久久免费视| 亚洲国产中文在线视频| 中文字幕在线观看免费视频| 久久伊人久久亚洲综合| 国产精品永久免费| 亚洲av无码不卡私人影院| 老司机午夜性生免费福利| 免费a级毛片网站| 偷自拍亚洲视频在线观看99| 国产精品免费看久久久无码| 国产精品偷伦视频免费观看了 |

<button id="oikue"><tbody id="oikue"></tbody></button>

<li id="oikue"><dl id="oikue"></dl></li>

<code id="oikue"><tr id="oikue"></tr></code>

<rt id="oikue"><acronym id="oikue"></acronym></rt>

<dl id="oikue"></dl>