標簽:能力
Mistral新旗艦決戰Llama 3.1!最強開源Large 2 123B,扛鼎多語言編程全能王
新智元報道編輯: 【新智元導讀】緊跟著Meta的重磅發布,Mistral Large 2也帶著權重一起上新了,而且參數量僅為Llama 3.1 405B的三分之一。不僅在編碼、數學...
OpenAI五級AGI戰略遭吐槽,命名不清、邏輯混亂,本質只是空洞營銷?
新智元報道編輯:耳朵 喬楊 【新智元導讀】OpenAI的最新AGI布局——5級路線圖再被吐槽是營銷手段,不僅對「超級智能」命名和定義存在模糊之處,5個級別的層次結...
開源模型超過最強閉源模型,Llama 3.1能否顛覆AI生態?|甲子光年
扎克伯格誓要把開源進行到底。作者|蘇霍伊 編輯|趙健Llama 3.1終于來了。 美國當地時間7月23日,Meta正式發布Llama 3.1。其包含8B、70B 和405B三個規模,最...
招聘 | 商湯研究院基礎視覺組&基礎多模態模型組研究員和實習崗位開放
「智猩猩招聘」將持續分享人工智能、硬科技領域在招職位信息,歡迎在看機會、在找工作的朋友關注。企業若有招聘需求,也可以關注本公眾號,通過「聯系我們」...
第四范式發布先知 AIOS 5.1,節省大模型算力硬件成本,提高 GPU 綜合利用率
今天,第四范式先知AIOS 5.1版本正式發布。該版本新增GPU資源池化(vGPU)能力,實現對硬件集群平臺化管理、算力資源的按需分配和快速調度,最多節省80%的硬...
馬斯克啟動全球最大AI集群,由10萬個英偉達H100組成
點擊上方藍字關注我們“埃隆·馬斯克領導的xAI孟菲斯超級集群啟動,配備十萬個Nvidia H100 GPU,旨在年底前訓練出世界最強AI,此舉或將重塑全球AI競爭格局。科...
ICML2024: 華中科大發現大模型具有自我認知
夕小瑤科技說 原創作者 | 謝年年不知道大家是否記得之前傳到沸沸揚揚的Bing的 Sydney事件。 起因是一位網友曬出了其與Bing的聊天記錄,其中Bing自述自己名叫S...
大模型時代結束?大佬齊預測:AI模型或需先縮小規模,才能再次擴大規模
新智元報道編輯:耳朵 【新智元導讀】小模型強勢來襲,「大模型時代」或將落幕?「小模型周」過去了 ,小模型的最新戰場才剛剛開辟。 上周GPT-4o mini和Mistr...
從 OpenAI 收購實時分析數據公司看未來數據庫長什么樣?
作者 | 冬梅 前不久,OpenAI 宣布收購了一家以數據索引及查詢功能而聞名的實時分析數據庫 Rockset。消息一出,數據庫領域和 AI 圈一片嘩然。 據悉,Rockset ...
1 周 3 ,小型模型反而更具潛力?
點擊上方藍字關注我們“本周,人工智能行業迎來重大變革,Hugging Face、Nvidia與Mistral AI及OpenAI相繼推出小型語言模型,旨在提高自然語言處理技術的普及度...
大模型“自學”后能力反下降,Llama/Mistral都沒逃過
PengFei Liu 投稿量子位 | 公眾號 QbitAIAI經過多輪“自我提升”,能力不增反降? 上海交通大學GAIR團隊最新研究表明,在常識理解、數學推理和代碼生成等復雜任...
華為GTS LocMoE+:高可擴展性親和度 MoE 架構,低開銷實現主動路由
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
上海AI lab開源LLaMAX,用3.5萬小時的A100訓練讓大模型掌握上百種語言翻譯
夕小瑤科技說 原創作者 | Richard 在這個AI大爆發的時代,各種智能工具如雨后春筍般涌現,大語言模型的能力也在不斷刷新我們的認知。隨便拉出一個AI模型,似...
OpenAI 秘密武器曝光!Q* 推理能力大爆發,逼近 AGI L2 里程碑
上周,一張OpenAI內部通往AGI最新路線圖,在全網掀起熱議。從圖中明顯可以看出,OpenAI將最終抵達AGI終點,劃分了五大等級: L1:聊天機器人,具有對話能力的...
粵公網安備 44011502001135號