標簽:基礎
16家頭部大模型公司上海神秘碰頭,現場人擠人人人
金磊 明敏 發自 上海量子位 | 公眾號 QbitAI擠爆了,簡直要被大模型公司們給擠爆了。 來感受一下這個feel: 毫不夸張地說,國內外叫得上來的大模型公司基本上...
State of GPT:大神Andrej揭秘OpenAI大模型原理和訓練過程
前言 OpenAI的創始人之一,大神Andrej Karpthy剛在微軟Build 2023開發者大會上做了專題演講:State of GPT(GPT的現狀)。 在這個樸實無華的題目之下,Andrej...
李彥宏歐洲談AI:比起GPT-5,我更感興趣超級應用
魚羊 發自 凹非寺量子位 | 公眾號 QbitAI中國AI與西方的最大區別是應用,中國有數百個基礎模型,但人們越來越多地在討論什么是AI時代的超級應用。 應用正在驅...
谷歌員工爆料Python基礎團隊原地解散
機器之心報道 編輯:蛋醬什么?谷歌解雇了整個 Python 基礎團隊?「當與你直接共事的每個人,包括你的主管,都被裁員 —— 哦,是職位被削減,而你被要求安排他...
阿里開源110B大模型!超越LLama3!
4月26日晚間,阿里正式發布了110B的千問1.5開源大模型。 110B是中文開源模型的最大尺寸,用了GQA,32k上下文,除了中文能力亮眼,英文表現效果好于LLama3 70B...
《大模型決策制定中的幻覺檢測》綜述
來源:專知 自主系統很快將無處不在,從制造業自主性到農業領域的機器人,再從醫療保健助手到娛樂產業。這些系統的大多數都是用于決策、規劃和控制的模塊化子...
八位院士發言!如何推動“基礎研究”高質量發展?
來源:《瞭望》 轉自:銳動源◆受訪專家(按姓氏筆畫排序): 中國科協副主席,北京大學常務副校長、醫學部主任,中國工程院院士?喬杰 廈門大學黨委書記、中國...
OpenAI 投資的機器人公司高管:具身智能會像 ChatGPT 一樣突然到來
2022 年,谷歌高級研究科學家 Eric Jang 離開 Google Robotics,以副總裁的身份加入 1X Technologies 負責 AI 工作。2023 年 3 月,1X 獲得了一輪由 OpenAI ...
DeepMind CEO:LLM+樹搜索就是AGI技術線路,AI科研依賴工程能力,閉源模型就是比開源安全
新智元報道編輯:潤 【新智元導讀】最近谷歌DeepMind的CEO Hassabis接受了多個播客主播的專訪,向大眾透露很多谷歌最近發布模型的內幕,以及他理解的如何通向...
限時下載 | 86頁!復旦大模型Agent綜述,一文縱覽AI智能體的現狀與未來
《基于LLMs的代理的興起和潛力:一項調查》是由復旦大學自然語言處理團隊(FudanNLP)推出的 LLM-based Agents 綜述論文,全文長達 86 頁,共有 600 余篇參考...
EMMS:高效的多模態多任務預訓練模型選擇器 | NeurIPS 2023
直播預告 | 今晚7點,「多模態大模型線上閉門會」正式開講!阿里巴巴通義實驗室 NLP 高級算法專家嚴明參與出品,攜手劉兆洋、李彥瑋、文束三位青年學者,共同...
吳恩達最新預測:關于AI,這些事未來十年不會變
金磊 發自 凹非寺量子位 | 公眾號 QbitAI2024年,AI的發展會有怎樣的改變? 在吳恩達最新的一封來信中,他認為有幾件事情在接下來十年內都不會發生改變。 (...
基礎模型+機器人:現在已經走到哪一步了
機器之心報道 編輯:Panda W機器人是一種擁有無盡可能性的技術,尤其是當搭配了智能技術時。近段時間創造了許多變革性應用的大模型有望成為機器人的智慧大腦...
告別冷啟動,LoRA成為大模型「氮氣加速器」,提速高達300%
選自Raphael G 的博客 機器之心編譯 作者:Raphael G 編輯:大盤雞用 LoRA打造更快的 AI 模型。AI 模型功能越來越強大,結構也越來越復雜,它們的速度也成為...
兩只羊駝掐頭去尾拼一起,屠榜HuggingFace
夢晨 發自 凹非寺量子位 | 公眾號 QbitAIHuggingFace開源大模型排行榜,又被屠榜了。 前排被清一色的SOLAR 10.7B微調版本占據,把幾周之前的各種Mixtral 8x7B...