標(biāo)簽:編碼器

LLM可解釋性的未來希望?稀疏自編碼器是如何工作的,這里有一份直觀說明

機(jī)器之心報(bào)道 編輯:Panda簡而言之:矩陣 → ReLU 激活 → 矩陣在解釋機(jī)器學(xué)習(xí)模型方面,稀疏自編碼器(SAE)是一種越來越常用的工具(雖然 SAE 在 1997 年左右...
閱讀原文

延遲交互模型,為什么是下一代RAG的標(biāo)配?

AIxiv專欄是機(jī)器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過去數(shù)年,機(jī)器之心AIxiv專欄接收報(bào)道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級(jí)實(shí)驗(yàn)室,有效促進(jìn)了學(xué)術(shù)...
閱讀原文

開放域檢測新SOTA!中山大學(xué)美團(tuán)出品,開源性能最強(qiáng)

王豪 投稿自 凹非寺量子位 | 公眾號(hào) QbitAI開放域檢測領(lǐng)域,迎來新進(jìn)展—— 中山大學(xué)聯(lián)合美團(tuán)提出新模型OV-DINO,實(shí)現(xiàn)開放域檢測開源新SOTA! 比Grounding DINO...
閱讀原文

iPhone可跑2B小鋼炮!谷歌Gemma 2來襲,最強(qiáng)顯微鏡剖解LLM大腦

新智元報(bào)道編輯:編輯部 【新智元導(dǎo)讀】谷歌DeepMind的小模型核彈來了,Gemma 2 2B直接擊敗了參數(shù)大幾個(gè)數(shù)量級(jí)的GPT-3.5和Mixtral 8x7B!而同時(shí)發(fā)布的Gemma S...
閱讀原文

殺瘋了!Meta開源SAM-2:可商用,隨意分割視頻、圖像

9月6-7日,2024全球AI芯片峰會(huì)將在北京召開。目前,AMD人工智能事業(yè)部高級(jí)總監(jiān)王宏強(qiáng),清華大學(xué)交叉信息研究院助理教授、北極雄芯創(chuàng)始人馬愷聲,珠海芯動(dòng)力創(chuàng)...
閱讀原文

科大訊飛將在港投資 4 億港元,專注大語言模型等開發(fā);英偉達(dá) Mistral AI 聯(lián)手發(fā)布 12B 參數(shù)小模型丨AI情報(bào)局

01 今日融資快報(bào)科大訊飛將在香港投資 4 億港元,并設(shè)立國際總部 科大訊飛公布了一項(xiàng)為期 5 年的 4 億港元、投資計(jì)劃,并在香港設(shè)立了國際總部。公司表示,這...
閱讀原文

盛名一時(shí)的BERT哪去了?這個(gè)問題的答案昭示了LLM范式的轉(zhuǎn)變

機(jī)器之心報(bào)道 編輯:Panda編碼器模型哪去了?如果 BERT 效果好,那為什么不擴(kuò)展它?編碼器 - 解碼器或僅編碼器模型怎么樣了?在大型語言模型(LLM)領(lǐng)域,現(xiàn)...
閱讀原文

拋棄視覺編碼器,這個(gè)「原生版」多模態(tài)大模型也能媲美主流方法

AIxiv專欄是機(jī)器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過去數(shù)年,機(jī)器之心AIxiv專欄接收報(bào)道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級(jí)實(shí)驗(yàn)室,有效促進(jìn)了學(xué)術(shù)...
閱讀原文

完全開源!謝賽寧發(fā)布最新SOTA多模態(tài)模型Cambrian-1,“不與GPT-4V媲美”

夕小瑤科技說 原創(chuàng)作者 | 21# 6月15日,智源大會(huì)「多模態(tài)大模型」論壇中,紐約大學(xué)助理教授謝賽寧從哲學(xué)的角度出發(fā),分享了AI是否需要更強(qiáng)的視覺基礎(chǔ)來實(shí)現(xiàn)理...
閱讀原文

霉霉開口唱碧昂絲的歌,又是AI!口型不出戲,五官姿態(tài)也自然,復(fù)旦百度等出品|GitHub攬星1k+

西風(fēng) 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI一張人像、一段音頻參考,就能讓霉霉在你面前唱碧昂絲的《Halo》。 一種名為Hallo的研究火了,GitHub已攬星1k+。 話...
閱讀原文

AI研究的主要推動(dòng)力會(huì)是什么?ChatGPT團(tuán)隊(duì)研究科學(xué)家:算力成本下降

機(jī)器之心報(bào)道 編輯:PandaAI 研究發(fā)展的主要推動(dòng)力是什么?在最近的一次演講中,OpenAI 研究科學(xué)家 Hyung Won Chung 給出了自己的答案。 近日,斯坦福大學(xué)《C...
閱讀原文

OpenAI新作署名Ilya,提取1600萬個(gè)特征看透GPT-4大腦!

新智元報(bào)道編輯:喬楊 好困 【新智元導(dǎo)讀】今天,OpenAI發(fā)布了一篇GPT-4可解釋性的論文,似乎是作為前兩天員工聯(lián)名信的回應(yīng)。網(wǎng)友細(xì)看論文才發(fā)現(xiàn),這居然是已...
閱讀原文

OpenAI公開GPT-4思維的新方法,Ilya也參與了!

西風(fēng) 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAIOpenAI研究如何破解GPT-4思維,公開超級(jí)對(duì)齊團(tuán)隊(duì)工作,Ilya Sutskever也在作者名單之列。 該研究提出了改進(jìn)大規(guī)模訓(xùn)...
閱讀原文

OpenAI新研究GPT-4大腦,分解1600萬個(gè)特征打開“黑匣子”,Ilya 、Jan Leike也參與了!

夕小瑤科技說 原創(chuàng)作者 | 付奶茶 6月7日凌晨,OpenAI在官網(wǎng)發(fā)布了一個(gè)新的研究成果,首次破解GPT-4的神經(jīng)網(wǎng)絡(luò)活動(dòng)。通過改進(jìn)大規(guī)模訓(xùn)練稀疏自動(dòng)編碼器將GPT-4...
閱讀原文

Ilya參與,OpenAI給GPT-4搞可解釋,提取了1600萬個(gè)特征,還能看它怎么想

機(jī)器之心報(bào)道 編輯:小舟、澤南、大盤雞大模型也可解釋了? 大模型都在想什么?OpenAI 找到了一種辦法,能給 GPT-4 做「掃描」,告訴你 AI 的思路,而且還把...
閱讀原文