標簽:權重

不用4個H100!340億參數Code Llama在Mac可跑,每秒20個token,代碼生成最拿手|Karpathy轉贊

新智元報道編輯:桃子【新智元導讀】現在,34B Code Llama模型已經能夠在M2 Ultra上的Mac運行了,而且推理速度超過每秒20個token,背后殺器竟是「投機采樣」...
閱讀原文

谷歌證實大模型能頓悟,特殊方法能讓模型快速泛化,或將打破大模型黑箱

新智元報道編輯:潤 好困【新智元導讀】谷歌團隊認為,模型泛化能力無處不在,只要摸清條件,模型就不是隨機鸚鵡。在特定情況下,人工智能模型會超越訓練數據...
閱讀原文
1678