標簽:知乎

大模型微調到底有沒有技術含量?

大模型時代最火AI芯片峰會來啦!!9月6-7日,由芯東西聯合主辦的2024全球AI芯片峰會將在北京舉行。峰會設有數據中心AI芯片、智算集群等7大板塊。目前,AMD人...
閱讀原文

ResNet作者張祥雨,投身AI大模型

衡宇 西風 發自 凹非寺量子位 | 公眾號 QbitAI大模型的人才黑洞效應,還在持續。 量子位獲悉,最新出現在大模型大牛轉會名單上的重磅大牛,是90后AI大牛張祥...
閱讀原文

太原理工2024軟件工程招60個班,近2000人,沖上熱搜

機器之心報道 機器之心編輯部這一屆軟件工程專業的學生占了 1/4,同班同學都是老鄉。都知道計算機專業火熱,沒想到竟然這么火。 剛剛,「2024 太原理工大學(...
閱讀原文

全網獨一份!AI大模型學習訓練資源…(限時免費領)

如果你問:2024年,程序員必須掌握哪項技術?AI一定是榜首! 從去年起,AI大模型已是程序員的必備工具——??????????????? 編程提效:編寫更快,程序更穩定; ...
閱讀原文

可解釋性終極追問,什么才是第一性解釋?20篇CCF-A+ICLR論文給你答案

AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
閱讀原文

零一萬物黃文灝:大模型訓練方及Yi-Large的實踐

9月6-7日,2024全球AI芯片峰會將在北京召開。目前,AMD人工智能事業部高級總監王宏強,清華大學交叉信息研究院助理教授、北極雄芯創始人馬愷聲,珠海芯動力創...
閱讀原文

張俊林:大語言模型無法對數字進行準確運算的主要原因

直播預告 | 7月23日14點,「智猩猩在線研討會 NVIDIA AI for Science 專場」將開講,兩位專家將分別以《AI 驅動下的新能源材料研究與發現》、《NVIDIA Modulu...
閱讀原文

大模型Infra這些年,從黑鐵時代到黃金時代再到白銀時代

7月16日19點,「智猩猩AI新青年講座」第244講將開講。上海交通大學和寧波東方理工大學聯合培養博士生徐良將主要講解通用的3D人體動作生成框架ActFormer和人體...
閱讀原文

數據匱乏仍是通用具身智能面前的高墻嗎?

機器之心PRO · 會員通訊 Week 28---- 本周為您解讀 ③個值得細品的AI & Robotics業內要事 ---- 1. 數據匱乏問題仍是通用具身智能面前的高墻嗎? 具身智能...
閱讀原文

kimi chat大模型的200萬長度無損上下文可能是如何做到的?

7月11日19點,「智猩猩自動駕駛新青年講座」第36講將開講,主講理想汽車最新成果:基于MLLM的閉環規劃智能體PlanAgent,由理想汽車實習研究員、中國科學院自...
閱讀原文

從零訓練的 1B 以下小模型匯總

導讀本文來自知乎,作者為Angry Bugs。出于學術/技術分享進行轉載,如有侵權,聯系刪文。 本文是作者自己從頭訓練一個1B以下的模型的相關技巧和資源的匯總。 ...
閱讀原文

清華北航博士生「」Gemma-2說中文!弱智吧、角色扮演、數學問題表現驚喜

新智元報道編輯:編輯部 【新智元導讀】谷歌的Gemma 2剛剛發布,清華和北航的兩名博士生就已經成功推出了指令微調版本,顯著增強了Gemma 2 9B/27B模型的中文...
閱讀原文

Kimi論文自曝推理架構,80%流量都靠它承擔

克雷西 發自 凹非寺量子位 | 公眾號 QbitAI月之暗面和清華KVCache.ai團隊的最新論文,首次揭秘了Kimi背后的推理架構! 要知道Kimi是國產大模型的當紅炸子雞,...
閱讀原文

AI 搜索熱潮背后:注定要逾越場景的門檻

諸多 AI 搜索產品的出現似乎意味著,創業做一個搜索產品的速度快了很多。但 AI 是否真的讓搜索引擎的入場門檻變低?其真正的護城河又是什么?作者丨王悅 編輯...
閱讀原文

鵝廠造10億虛擬人格專搞數據合成:讓7B模型數學成績打平GPT4,還能給弱智吧出題

克雷西 發自 凹非寺量子位 | 公眾號 QbitAI10億名“員工”生產數據合成,數量占到了世界人口的13%。 不過這些“員工”并不是真人,而是騰訊利用網絡數據制造出的...
閱讀原文
13456719