標簽:性能
全球首臺Arm超算光榮退役!下一代已接任,配備384塊英偉達Grace CPU
新智元報道編輯:桃子 【新智元導讀】世界上首個基于Arm架構的超算,完成6年使命之后,終于要退役了。這臺被部署在英國最強超算Isambard 2,幫助世界推動了模...
單靠推理Scaling Law無法成就o1!無限推理token,GPT-4o依然完敗
新智元報道編輯:編輯部 HXY 【新智元導讀】o1的秘訣,和全新的「推理Scaling Law」關系有多大?Epoch AI最近的對比實驗表明,算法創新才是關鍵。CoT鑄就了o1...
最高配 128 核!英特爾至強 6 性能核處理器發布:運行 Llama2-7B 快了 3.08 倍
作者 | 褚杏娟 “英特爾至強 6 性能核,將是英特爾有史以來性能最強大的至強處理器。”英特爾數據中心與人工智能集團副總裁、中國區總經理陳葆立在 9 月 6 日...
利用公開知識定向提升大模型,騰訊優圖&上交大提出新方法,性能達SOTA
優圖實驗室 投稿量子位 | 公眾號 QbitAI告別傳統指令微調,大模型特定任務性能提升有新方法了。 一種新型開源增強知識框架,可以從公開數據中自動提取相關知...
英特爾最強服務器CPU來了!AI性能直接翻倍
夢晨 金磊 發自 凹非寺量子位 | 公眾號 QbitAI服務器CPU領域持續多年的核心數量大戰,被一舉終結了! 英特爾最新發布的至強?6 性能核處理器(P-core系列),...
英偉達RTX 5090功耗高達600W,32G顯存,核心比5080多一倍
機器之心報道 編輯:澤南、小舟RTX 50 系列的發布日期可能會在明年初。英偉達的 RTX 50 系列會整出什么新活? 隨著芯片發布日期的臨近,人們的猜測也越來越密...
英偉達開源NVLM 1.0屠榜多模態!純文本性能不降反升
新智元報道編輯:LRS 【新智元導讀】NVLM 1.0系列多模態大型語言模型在視覺語言任務上達到了與GPT-4o和其他開源模型相媲美的水平,其在純文本性能甚至超過了L...
CoT神話破滅,并非LLM標配!三大學府機構聯手證實,CoT僅在數學符號推理有用
新智元報道編輯:桃子 【新智元導讀】CoT只對數學、符號推理才起作用,其他的任務幾乎沒什么卵用!這是來自UT-Austin、霍普金斯、普林斯頓三大機構研究人員聯...
o1帶火的CoT到底行不行?新論文引發了論戰
機器之心報道 編輯:PandaTo CoT or not to CoT? OpenAI ο1 的誕生極大地提升了人們對 LLM 推理能力和思維鏈(CoT)的興趣。一時之間,似乎思維鏈很快就會成...
從架構、工藝到能效表現,全面了解LLM硬件加速,這篇綜述就夠了
機器之心報道 編輯:陳陳、杜偉大語言模型(LLM)的發展同時往往伴隨著硬件加速技術的進化,本文對使用 FPGA、ASIC 等芯片的模型性能、能效表現來了一次全面...
MMMU華人團隊更新Pro版!多模態基準升至史詩級難度:過濾純文本問題、引入純視覺問答
新智元報道編輯:LRS 【新智元導讀】MMMU-Pro通過三步構建過程(篩選問題、增加候選選項、引入純視覺輸入設置)更嚴格地評估模型的多模態理解能力;模型在新...
國產最大MoE開源模型發布!騰訊AI Lab創始人帶隊,已融2億美元
2550億參數、免費可商用,前騰訊副總裁創業。 編輯|香草 智東西9月13日報道,今日,大模型創企元象XVERSE發布國內最大MoE開源模型XVERSE-MoE-A36B,其總參數2...
邊緣智能的新時代:端側大模型的研究進展綜述
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
TensorRT-LLM保姆級教程(一)-快速入門
隨著大模型的爆火,投入到生產環境的模型參數量規模也變得越來越大(從數十億參數到千億參數規模),從而導致大模型的推理成本急劇增加。因此,市面上也出現...
索尼發布 PS5 Pro,價格比性能飛更高
PS5 Pro 價格比性能 飛更高昨晚,PlayStation 官方在 YouTube 頻道的直播中放出了 PS5 Pro 的技術演示。 這是 PS5 從 2020 年發布以來,首次進行性能升級,PS...