国产精品亚洲mnbav网站_成人午夜亚洲精品无码网站_日韩va亚洲va欧洲va国产_亚洲欧洲精品成人久久曰影片

用LLaVA解讀數萬神經元,大模型竟然自己打開了多模態智能黑盒

AIGC動態9個月前發布 機器之心
226 0 0

AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術交流與傳播。如果您有優秀的工作想要分享,歡迎投稿或者聯系報道。投稿郵箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com本文主要作者來自LMMs-Lab團隊與新加坡南洋理工大學,分別是張愷宸、沈逸飛、李博,指導老師為MMLab@NTU劉子緯教授。LMMs-Lab是一個由學生,研究人員和教師組成的團隊,致力于多模態模型的研究,主要研究方向包括多模態模型的訓練以及全面評估,此前的工作包括多模態測評框架 LMMs-Eval,以及多模態模型 LLaVA-OneVision,長視頻理解模型LongVA等。多模態大模型(LMMs)給語言模型裝上了 “眼睛”,讓 AI 更接近通用智能。但它們的大腦里每個神經元到底在干啥?南洋理工大學 LMMs-Lab 團隊用 “模型看模型” 的方法,成功解鎖了數十萬神經元的秘密。以 GPT4V 為代表的多模態大模型(LMMs)在大語言模型(LLMs)上增加如同視覺的多感官技能,以實現更強的通用智能。雖然 LMMs 讓人類更加接近創造智慧,但迄今為止,我們并不能理解自然與人工的多模態智能是如何產生的。像 LLaVA 一樣的開源模型是理解多模態智能的一個契機。但這些模型(在未來)可能比人類更加聰明,如何去理解他們的智力呢?來自南洋理工大學的 LMMs-Lab 團隊給出的解決方案是:問問 LLaVA 自己是怎么說的。LMMs-Lab 團隊使用 LLaVA-OV-72B 對 LLaVA-NeXT-8B 中的神經元進行了自動解讀,獲得了非常多有趣的結果。傳統的可解釋性的研究是人工去檢查每個神經元并且解讀他們的含義。這樣的操作很難拓展到多模態大模型上:其一,多模態大模型的神經元數量是傳統模型的成百上千倍,人工檢查成本過于高昂;其二,根據神經科學中的分布式表示原理,一個神經元可能會有多個含義,一個語義可能分布在多個神經元當中。在大語言模型中,OpenAI 和 Anthropic 提出了使用稀疏自編碼機來解離特征表示,或者用更大的語言模型來解讀小模型里面的神經元。比如使用 GPT-4 解讀 GPT-2。但這些工作尚未被應用到多模態模型當中,圖像作為比語言更加自然的信號,解讀圖像與文字的交互能讓人們更加理解智能的產生。LMMs-Lab 基于這些工作對于 LLaVA-NeXT-8B 做出了初步的嘗試:使用稀疏自編碼機(SAEs)來把多語義神經元解離為單語義神經元,并且用 LLaVA-OV-72B 對單語義神經元進行自動解釋,解釋能夠接近人類水平。論文地址:arxiv.org/abs/2411.14982代碼:EvolvingLMMs-Lab/multimodal-sae: Auto Interpretation Pipeline and many other functionalities for Multimodal SAE Analysis.5k 個神經元解讀樣例:lmms-lab/llava-sae-explanations-5k?Datasets at Hugging Face這個項目能夠讓自動挖掘多模態大模型中神經元的語義信息,讓后續研究工作可以通過修改神經元的激活來改變模型行為,包括減少幻覺和增加安全性。(a) 把 SAE 放在 Llava 的某一層并且在 Llava-NEXT 所有數據上訓練;(b) 找到一個神經元的最大激活的圖片和區域,讓 Llava 找出公共點;(c) 神經元可以改變模型行為具體方法使用 LMMs 解釋 LMMs 分為以下個步驟:步驟一:用 SAEs 獲得單語義神經元SAE 是一個可以追溯到 1996 年的經典解釋性的方法 [1] ,其本質是對特征找到一組互相關性很小的基,把特征分解為這組基的一個稀疏表示。因為基的互相關性很小,所以這些基很可能是單語義的。這篇文章使用了 OpenAI 的兩層 SAE 實現:其中 z 是稀疏表示也是 SAEs 的神經元,W_2 是一組基。步驟二:使用 LLaVA 解釋單語義神經元對于上一步當中 SAE 的每個神經元 z,獲得訓練集里面激活最大的 K 張圖片,以及激活最大的圖像區域,把這些圖像給 LLaVA-OV-72B 找出共同點。模型對神經元生成的解釋:炸薯條。步驟三:對應的神經元把 SAE 神經元的激活值調高,看看模型如何表現。可以看到,無論是否包含圖像輸入或者是純文字輸入,LMM 與 LLM 的不同之處在于能夠理解視覺輸入,我們在稀疏編碼器的神經元中也找到了許多與 LLM 不一樣的地方。在進行神經元探測時,我們發現不同于先前的 LLM 工作,往往激活最強烈的神經元并不是與高層級概念直接相關的,而是許多低層級的感知神經元。這體現了模型的思考步驟,先看懂物體是什么,再去思考更高層級的抽象概念,譬如情感等概念。LMMs 獨特的神經元低層級感知神經元:對線條形狀紋理激活的神經元物體神經元感情與共情神經元這種方法找到了很多情感神經元,在這些神經元之前,模型是一個冰冷的 AI,這些神經元能夠引發模型的共情。多模態一致性神經元對動作場景,以及對應文字圖像都激活的神經元。下圖描繪了對于吃和 hungry 文字都激活的神經元,這樣的神經元在人腦中也存在 [2] 。定位模型錯誤原因LMM 在實際應用使往往會產生許多幻覺,上面便是 LLaVA-NeXT-8B 在實際場景下產生幻覺的一個例子,圖片中并未標注玻利維亞但模型仍舊回答了 “Yes”。為了研究為何產生這一現象以及如何通過神經元的方式抑制這一現象,我們效仿了 [3,4] 的方法進行探究。通過探究發現,造成模型輸出 Yes 的罪魁禍首并不在圖像的理解能力上,模型能夠很好的找到需要關注的點,并準確的找到各個國家的名字。然而,在文字上面,我們發現模型過分的關注了 Bolivia 這一詞,導致了最后的輸出產生幻覺。通過這一探究,我們思考如何能夠抑制這一幻覺現象并展開了實驗。我們展示了兩個例子用神經元的方式成功抑制了這一現象。我們嘗試激活 OCR 相關的神經元,強行讓模型關注點集中在圖像上,而這成功使得模型 “回心轉意”,不再依賴文字的輸出。可能的應用以及局限性因為這超出了文章的范圍,這篇文章只給出了一個應用:找到引起幻覺的神經元并糾正。在未來,這樣的方法可以找出模型有危害、不誠實行為的原因并加以修正,真正達到可控的 AGI。但到達這個目標還有很多問題需要一一攻克:1. 更高效的自動可解釋流程 —— 由于稀疏編碼器中的神經元數量眾多且需要緩存大量激活值,解釋所有神經元在目前代價十分高昂。2. 自動激活神經元的流程 —— 自動且高效地尋找并神經元從而達到控制模型輸出的目的3. 更準確的自動解釋流程 —— 由于模型的局限性,許多神經元的解釋往往存在錯誤,隨著多模態大模型的推理能力逐漸增強,我們相信這一問題將會被慢慢攻克參考文獻[1] Bruno A Olshausen and David J Field. Emergence of simple-cell receptive field properties by learning a sparse code for natural images. Nature, 381 (6583):607–609, 1996.[2] R Quian Quiroga, Leila Reddy, Gabriel Kreiman, Christof Koch, and Itzhak Fried. Invariant visual representation by single neurons in the human brain. Nature, 435 (7045):1102–1107, 2005.[3] Neel Nanda. Attribution patching: Activation patching at industrial scale. https://www.neelnanda.io/mechanistic-interpretability/attribution-patching,2023.Accessed: 2024-09-30.[4] Adly Templeton, Tom Conerly, Jonathan Marcus, Jack Lindsey, Trenton Bricken, Brian Chen, Adam Pearce, Craig Citro, Emmanuel Ameisen, Andy Jones, Hoagy Cunningham, Nicholas L Turner, Callum McDougall, Monte MacDiarmid, C. Daniel Freeman, Theodore R. Sumers, Edward Rees, Joshua Batson, Adam Jermyn, Shan Carter, Chris Olah, and Tom Henighan. Scaling monosemanticity: Extracting interpretable features from claude 3 sonnet. Transformer Circuits Thread, 2024?THE END轉載請聯系本公眾號獲得授權投稿或尋求報道:liyazhou@jiqizhixin.com

閱讀原文
? 版權聲明
蟬鏡AI數字人

相關文章

蟬鏡AI數字人

暫無評論

暫無評論...
国产精品亚洲mnbav网站_成人午夜亚洲精品无码网站_日韩va亚洲va欧洲va国产_亚洲欧洲精品成人久久曰影片
<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        国产精品色眯眯| 国产精品亚洲第一区在线暖暖韩国| 亚洲欧洲精品一区二区三区不卡| 国产a视频精品免费观看| 亚洲精品一区二区在线观看| 日本一区中文字幕| 日韩欧美国产三级| 亚洲主播在线播放| 亚洲小说春色综合另类电影| 色94色欧美sute亚洲线路一久| 亚洲欧美日韩中文字幕一区二区三区 | 成人久久视频在线观看| 国产精品美女久久久久aⅴ | 97精品视频在线观看自产线路二| 亚洲色欲色欲www| 欧美日韩国产不卡| 国产一区二区在线看| 亚洲人123区| 精品黑人一区二区三区久久| 波多野洁衣一区| 日本亚洲免费观看| 国产精品美女久久久久久久久久久 | 精品国产露脸精彩对白| 丰满岳乱妇一区二区三区| 亚洲妇熟xx妇色黄| 国产日产亚洲精品系列| 在线中文字幕一区| 国产福利电影一区二区三区| 亚洲国产成人av好男人在线观看| 久久精品这里都是精品| 91传媒视频在线播放| 国产剧情一区在线| 偷拍亚洲欧洲综合| 中文字幕在线观看一区| 日韩精品一区二区三区中文精品| 色婷婷av久久久久久久| 久久91精品久久久久久秒播| 亚洲图片另类小说| 久久久美女艺术照精彩视频福利播放| 欧美亚洲综合色| 成人深夜福利app| 免费不卡在线视频| 丝袜美腿高跟呻吟高潮一区| 国产精品三级av| 日韩三级高清在线| 欧美日韩免费在线视频| 成人18视频日本| 国产精品456| 精品亚洲成av人在线观看| 日韩和欧美的一区| 婷婷成人综合网| 亚洲综合成人在线视频| 玉足女爽爽91| 亚洲日本一区二区三区| 亚洲日本丝袜连裤袜办公室| 国产精品久久毛片| 中文字幕+乱码+中文字幕一区| 欧美变态tickling挠脚心| 欧美老女人第四色| 在线观看网站黄不卡| 91视频在线观看免费| 波多野结衣在线一区| 国产精品亚洲一区二区三区妖精| 奇米色777欧美一区二区| 三级精品在线观看| 日韩黄色片在线观看| 日产精品久久久久久久性色| 首页亚洲欧美制服丝腿| 日本美女一区二区| 美国精品在线观看| 韩国女主播成人在线观看| 欧美aaaaaa午夜精品| 日本亚洲欧美天堂免费| 狠狠色综合播放一区二区| 狠狠色丁香婷综合久久| 国产一区二区三区久久久 | 欧美一卡2卡3卡4卡| 欧美一区二区精品| 欧美精品一区二区三区在线播放 | 蜜桃91丨九色丨蝌蚪91桃色| 全国精品久久少妇| 国产在线国偷精品产拍免费yy| 国产精品中文字幕一区二区三区| 国产精品一级片| 色婷婷综合久久久中文一区二区| 欧美私人免费视频| 精品久久久久久久人人人人传媒 | 日本va欧美va瓶| 久久国产精品第一页| 国产精品一区二区在线观看不卡| 成人精品在线视频观看| 色一情一乱一乱一91av| 日韩午夜小视频| 国产欧美精品一区| 成人免费一区二区三区视频| 亚洲电影一区二区三区| 国产伦精一区二区三区| av成人免费在线观看| 欧美美女一区二区三区| 中文字幕免费不卡| 丝袜美腿成人在线| 色综合激情五月| 欧美电视剧免费全集观看| 国产精品白丝在线| 久久精品国产免费看久久精品| 不卡区在线中文字幕| 日韩一二在线观看| 亚洲欧美另类图片小说| 国产在线国偷精品产拍免费yy| 欧美色国产精品| 久久久九九九九| 午夜影院在线观看欧美| 成人性生交大片免费看视频在线 | 在线日韩一区二区| 久久精品在线免费观看| 日本不卡一二三| 色国产综合视频| 国产精品久久久久久久久免费丝袜 | 午夜精品在线看| 99久久精品国产一区二区三区| 日韩限制级电影在线观看| 亚洲三级久久久| 国产91在线观看丝袜| 欧美一区二区三区爱爱| 亚洲第一综合色| 色天使久久综合网天天| 欧美韩国日本不卡| 韩国精品主播一区二区在线观看| 3atv一区二区三区| 亚洲高清免费观看| 色吊一区二区三区| 国产精品卡一卡二卡三| caoporm超碰国产精品| wwww国产精品欧美| 精品一二三四区| 欧美mv日韩mv| 乱一区二区av| 777亚洲妇女| 天天综合网天天综合色| 欧美性猛片aaaaaaa做受| 亚洲国产毛片aaaaa无费看| 欧美性生交片4| 亚洲乱码中文字幕综合| 成人av网址在线观看| 国产日韩视频一区二区三区| 国产精品主播直播| 亚洲欧洲美洲综合色网| 色老综合老女人久久久| 一级日本不卡的影视| 在线亚洲人成电影网站色www| 亚洲精品视频自拍| 欧美精品aⅴ在线视频| 日韩高清国产一区在线| 精品少妇一区二区三区 | 美女视频一区在线观看| 日韩视频在线你懂得| 久久99热99| 国产女主播在线一区二区| 国产精品一区二区免费不卡 | 国产成人精品影视| 欧美激情在线一区二区| 91日韩精品一区| 午夜欧美2019年伦理| 免费不卡在线视频| 国产亚洲一本大道中文在线| 波多野洁衣一区| 日韩高清不卡一区二区三区| 久久九九国产精品| 色综合久久中文综合久久97| 亚洲第一福利视频在线| 欧美zozozo| 色猫猫国产区一区二在线视频| 亚洲成人综合视频| 日韩精品专区在线影院重磅| 丁香桃色午夜亚洲一区二区三区| 综合久久综合久久| 91精品国产综合久久蜜臀 | 国产精品一区二区三区网站| 亚洲精品久久嫩草网站秘色| 91精品国产综合久久精品图片 | 亚洲人亚洲人成电影网站色| 欧美视频你懂的| 国产美女av一区二区三区| 日韩一区中文字幕| 日韩欧美国产电影| 欧美在线小视频| av在线不卡免费看| 精品综合免费视频观看| 亚洲综合偷拍欧美一区色| 日韩一区二区三区免费观看| 91免费在线看| 成熟亚洲日本毛茸茸凸凹| 日韩高清在线一区| 亚洲最大成人网4388xx| 久久伊99综合婷婷久久伊| 欧美日韩国产123区| 色偷偷久久人人79超碰人人澡| 国产最新精品免费| 日本va欧美va精品发布| 亚洲一区二区三区视频在线播放|