碾壓H100!英偉達GH200超級芯片首秀MLPerf v3.1,性能躍升17%
新智元報道編輯:編輯部【新智元導讀】傳說中的英偉達GH200在MLPerf 3.1中驚艷亮相,性能直接碾壓H100,領先了17%。繼4月份加入LLM訓練測試后,MLPerf再次迎...
推理飆升2倍!普林斯頓北大校友祭出多頭「美杜莎」,33B模型與13B一樣快
新智元報道編輯:桃子 好困【新智元導讀】大模型推理加速如何破局?普林斯頓、UIUC等機構華人團隊提出一個簡單框架Medusa,訓練多個解碼頭,直接讓LLM推理速...
Dojo超算將使特斯拉股價飆升60%?摩根士丹利66頁報告出爐
新智元報道編輯:編輯部【新智元導讀】摩根士丹利分析師66頁研究報告出爐了!因為Dojo超算,特斯拉被再次看好,隨即市值飆升700多億美元。特斯拉比英偉達更擅...
超越ToT,蘇黎世理工發布新一代思維圖GoT:推理質量提升62%,成本降低31%
新智元報道編輯:LRS【新智元導讀】推理速度、推理質量二者兼得,全新一代思維圖GoT可以處理更復雜推理任務!大型語言模型在推理上仍然是弱勢項目,需要依賴...
李云龍、謝耳朵專業陪聊!角色扮演系統ChatHaruhi爆火:支持32個中外角色,開源5.4萬條對話數據
新智元報道編輯:LRS【新智元導讀】GitHub斬獲700+stars,除了二次元角色,ChatHaruhi還支持《武林外傳》、《亮劍》、《生活大爆炸》、于謙等經典角色!「角...
文勇剛:大模型時代,我們需要怎樣的數據中心?丨GAIR 2023
如何平衡AI發展和能耗間的關系,是未來數字化科技發展的重要課題。作者丨代潤澤編輯丨劉 偉2023年8月14日、15日,由GAIR研究院、雷峰網、世界科技出版社、科...
CIKM 2023|TASTE:通過文本匹配緩解序列化推薦中流行偏差問題
作者丨劉正皓1、梅森1、熊辰炎2、李曉華1、于是 3、劉知遠3、谷峪1、于戈1機構丨1. 東北大學;2. 卡內基梅隆大學;3. 清華大學該論文發表于CIKM-2023論文鏈接...
湯道生的下一場戰事:大模型時代的產業「智能化」升級戰怎么打?
機器之心原創作者:張倩湯道生談大模型時代產業「智能化」打法:直奔主題、跑「馬拉松」、保持開放。2023 年上半年,百模大戰如火如荼,成了國內 AI 領域最熱...
攀爬、跳躍、過窄縫,開源強化學習策略讓機器狗能跑酷了
機器之心報道編輯:小舟主打一個迅速。跑酷是一項極限運動,對機器人特別是四足機器狗來說,更是一項巨大的挑戰,需要在復雜的環境中快速克服各種障礙。一些...
32卡176%訓練加速,開源大模型訓練框架Megatron-LLaMA來了
機器之心發布機器之心編輯部9 月 12 日,淘天集團聯合愛橙科技正式對外開源大模型訓練框架 ——Megatron-LLaMA,旨在讓技術開發者們能夠更方便的提升大語言模型...
llama2.mojo比llama2.c快20%,最年輕的語言Mojo驚艷開發者社區
機器之心報道編輯:梓文你聽說過 Mojo 的「傳奇色彩」嗎?如果說 Python 是最流行的語言,C 語言是最經典的語言,那么 Mojo 也有它的之最 —— 最年輕。Mojo 能...
GPT太「奢侈」,平替大匯總來了,再也不用擔心部署大難題
機器之心報道機器之心編輯部超多平替,按需選取。近年來,生成式預訓練模型(如 GPT)的興起徹底顛覆了自然語言處理領域,其影響甚至已經延伸到其他多種模態...
大模型熱潮下的實習生:人均985?卻在大廠“打標簽”|甲子光年
好奇和憧憬背后,感受到真實的混亂和價值感匱乏。作者|朱悅編輯|栗子正式實習的第一天,晨曦感覺自己可能“被騙”了。剛剛結束完學校的畢業論文,準研究生晨...
AI“點名神器”進入高校課堂 網友:幸虧畢業早
大數據文摘授權轉載自IT時報作者:毛宇編輯:王昕、孫妍近日,有網友在社交平臺曬出自己大學的新型點名方式——自帶“人臉識別”功能的黑科技AI攝像頭?!霸?、2、...
?基爾大學研發水凝膠新材料,形似人類肌肉,可實現短時間內受控方式擴張與收縮
大數據文摘授權轉載自機器人大講堂作者:李鑫由金屬和其他固體材料加工而成的機器人已經廣泛應用于工業領域,但對于需要精細化動作譬如醫療和護理行業來講,...