標簽:研究者

AI黑盒研究的突破性進展:Anthropic詳解大模型的「思維」特征

一直以來 AI 都是一個黑盒子(black box),其內部運作機制是不可見的。人們輸入數據并得到結果,但無法檢查輸出結果的邏輯或者系統的代碼。 而就在剛剛,Ant...
閱讀原文

用基礎模型指導特征傳播,首個泛化型圖像匹配器OmniGlue搞定未見過域

機器之心報道 編輯:杜偉第一個以「泛化」能力為核心設計原則的可學習圖像匹配器來了!對于想要獲取兩張圖像之間的細粒度視覺對應關系而言,局部圖像特征匹配...
閱讀原文

從80個模型中構建Scaling Law:華人博士生新作,思維鏈提出者力薦

機器之心報道 編輯:小舟、陳萍在 AI 領域,擴展定律(Scaling laws)是理解 LM 擴展趨勢的強大工具,其為廣大研究者提供了一個準則,該定律在理解語言模型的...
閱讀原文

從Claude 3中提取數百萬特征,首次詳細理解大模型的「思維」

機器之心報道 編輯:陳萍、小舟剛剛,Anthropic 宣布在理解人工智能模型內部運作機制方面取得重大進展。Anthropic 已經確定了如何在 Claude Sonnet 中表征數...
閱讀原文

一鍵“搬空”你未來的新家,AI讓買房裝修變簡單了?

大數據文摘授權轉載自夕小瑤科技說作者:Richard 大家肯定都幻想過,要是能按自己的想法隨心所欲布置新家該多好啊。租房或買房時看中一處房子,如果能在看房...
閱讀原文

AI一鍵"搬空"你未來的新家,買房裝修變得簡單了?

夕小瑤科技說 原創作者 | Richard大家肯定都幻想過,要是能按自己的想法隨心所欲布置新家該多好啊。租房或買房時看中一處房子,如果能在看房前先把家具'搬空'...
閱讀原文

GPT-4通過圖靈測試,勝率高達54%!UCSD新作:人類無法認出GPT-4

新智元報道編輯:桃子庸庸 【新智元導讀】GPT-4通過圖靈測試了!UCSD研究團隊通過實證研究,人類無法將GPT-4與人類進行區分。而且,有54%的情況下,它被判定...
閱讀原文

清華團隊研發腦啟發AI模型,為感知信息處理提供全新范例

來源:腦機接口社區 運營/排版:何晨龍 人類天生具有分離各種音頻信號的能力,比如區分不同的說話者的聲音、或將聲音與背景噪音區分開來。這種天生的能力被稱...
閱讀原文

DiT架構大一統:一個框架集成圖像、視頻、音頻和3D生成,可編輯、能試玩

機器之心報道 編輯:杜偉、大盤雞基于 Diffusion Transformer(DiT)又迎來一大力作「Flag-DiT」,這次要將圖像、視頻、音頻和 3D「一網打盡」。今年 2 月初...
閱讀原文

Flash Attention穩定嗎?Meta、哈佛發現其模型權重偏差呈現數量級波動

機器之心報道 機器之心編輯部Meta FAIR 聯合哈佛優化大規模機器學習時產生的數據偏差,提供了新的研究框架。眾所周知,大語言模型的訓練常常需要數月的時間,...
閱讀原文

KAN核心團隊震撼力作!MIT華人用AI首次發現物理學全新方程

新智元報道編輯:Aeneas 好困 【新智元導讀】剛剛提出了KAN的MIT物理學家Max Tegmark和北大校友劉子鳴,又有一項重磅研究問世了!團隊發現,它們用AI發現了物...
閱讀原文

最詳細人腦3D地圖登Science!GPT-4參數只相當于人類0.2%

克雷西 發自 凹非寺量子位 | 公眾號 QbitAI芝麻粒大小的人腦組織,突觸規模就相當于一個GPT-4! 谷歌與哈佛聯手,對局部人腦進行了納米級建模,論文已登Scien...
閱讀原文

原作者帶隊,LSTM真殺回來了!

機器之心報道 編輯:蛋醬LSTM:這次重生,我要奪回 Transformer 拿走的一切。20 世紀 90 年代,長短時記憶(LSTM)方法引入了恒定誤差選擇輪盤和門控的核心思...
閱讀原文

終于有人調查了小模型過擬合:三分之二都有數據污染,微軟Phi-3、Mixtral 8x22B被點名

機器之心報道 編輯:佳琪、蛋醬當前最火的大模型,竟然三分之二都存在過擬合問題? 剛剛出爐的一項研究,讓領域內的許多研究者有點意外。提高大型語言模型的...
閱讀原文

參數量不到10億的OctopusV3,如何媲美GPT-4V和GPT-4?

AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
閱讀原文
13456713