標簽:編碼器
延遲交互模型,為什么是下一代RAG的標配?
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
LLM可解釋性的未來希望?稀疏自編碼器是如何工作的,這里有一份直觀說明
機器之心報道 編輯:Panda簡而言之:矩陣 → ReLU 激活 → 矩陣在解釋機器學習模型方面,稀疏自編碼器(SAE)是一種越來越常用的工具(雖然 SAE 在 1997 年左右...
開放域檢測新SOTA!中山大學美團出品,開源性能最強
王豪 投稿自 凹非寺量子位 | 公眾號 QbitAI開放域檢測領域,迎來新進展—— 中山大學聯合美團提出新模型OV-DINO,實現開放域檢測開源新SOTA! 比Grounding DINO...
iPhone可跑2B小鋼炮!谷歌Gemma 2來襲,最強顯微鏡剖解LLM大腦
新智元報道編輯:編輯部 【新智元導讀】谷歌DeepMind的小模型核彈來了,Gemma 2 2B直接擊敗了參數大幾個數量級的GPT-3.5和Mixtral 8x7B!而同時發布的Gemma S...
殺瘋了!Meta開源SAM-2:可商用,隨意分割視頻、圖像
9月6-7日,2024全球AI芯片峰會將在北京召開。目前,AMD人工智能事業部高級總監王宏強,清華大學交叉信息研究院助理教授、北極雄芯創始人馬愷聲,珠海芯動力創...
科大訊飛將在港投資 4 億港元,專注大語言模型等開發;英偉達 Mistral AI 聯手發布 12B 參數小模型丨AI情報局
01 今日融資快報科大訊飛將在香港投資 4 億港元,并設立國際總部 科大訊飛公布了一項為期 5 年的 4 億港元、投資計劃,并在香港設立了國際總部。公司表示,這...
盛名一時的BERT哪去了?這個問題的答案昭示了LLM范式的轉變
機器之心報道 編輯:Panda編碼器模型哪去了?如果 BERT 效果好,那為什么不擴展它?編碼器 - 解碼器或僅編碼器模型怎么樣了?在大型語言模型(LLM)領域,現...
拋棄視覺編碼器,這個「原生版」多模態大模型也能媲美主流方法
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
完全開源!謝賽寧發布最新SOTA多模態模型Cambrian-1,“不與GPT-4V媲美”
夕小瑤科技說 原創作者 | 21# 6月15日,智源大會「多模態大模型」論壇中,紐約大學助理教授謝賽寧從哲學的角度出發,分享了AI是否需要更強的視覺基礎來實現理...
霉霉開口唱碧昂絲的歌,又是AI!口型不出戲,五官姿態也自然,復旦百度等出品|GitHub攬星1k+
西風 發自 凹非寺量子位 | 公眾號 QbitAI一張人像、一段音頻參考,就能讓霉霉在你面前唱碧昂絲的《Halo》。 一種名為Hallo的研究火了,GitHub已攬星1k+。 話...
AI研究的主要推動力會是什么?ChatGPT團隊研究科學家:算力成本下降
機器之心報道 編輯:PandaAI 研究發展的主要推動力是什么?在最近的一次演講中,OpenAI 研究科學家 Hyung Won Chung 給出了自己的答案。 近日,斯坦福大學《C...
OpenAI新作署名Ilya,提取1600萬個特征看透GPT-4大腦!
新智元報道編輯:喬楊 好困 【新智元導讀】今天,OpenAI發布了一篇GPT-4可解釋性的論文,似乎是作為前兩天員工聯名信的回應。網友細看論文才發現,這居然是已...
OpenAI公開GPT-4思維的新方法,Ilya也參與了!
西風 發自 凹非寺量子位 | 公眾號 QbitAIOpenAI研究如何破解GPT-4思維,公開超級對齊團隊工作,Ilya Sutskever也在作者名單之列。 該研究提出了改進大規模訓...
OpenAI新研究GPT-4大腦,分解1600萬個特征打開“黑匣子”,Ilya 、Jan Leike也參與了!
夕小瑤科技說 原創作者 | 付奶茶 6月7日凌晨,OpenAI在官網發布了一個新的研究成果,首次破解GPT-4的神經網絡活動。通過改進大規模訓練稀疏自動編碼器將GPT-4...
Ilya參與,OpenAI給GPT-4搞可解釋,提取了1600萬個特征,還能看它怎么想
機器之心報道 編輯:小舟、澤南、大盤雞大模型也可解釋了? 大模型都在想什么?OpenAI 找到了一種辦法,能給 GPT-4 做「掃描」,告訴你 AI 的思路,而且還把...