標簽：大小

3140參數Grok-1推理加速3.8倍，PyTorch+HuggingFace版來了

明敏發自凹非寺量子位 | 公眾號 QbitAI馬斯克說到做到開源Grok-1，開源社區一片狂喜。但基于Grok-1做改動or商用，都還有點難題： Grok-1使用Rust+JAX構建...

2年前 (2024)

魚羊克雷西發自凹非寺量子位 | 公眾號 QbitAI馬斯克說到做到：旗下大模型Grok現已開源！代碼和模型權重已上線GitHub。官方信息顯示，此次開源的Grok-1是...

2年前 (2024)

新智元報道編輯：編輯部【新智元導讀】線性RNN贏了？近日，谷歌DeepMind一口氣推出兩大新架構，在d基準測試中超越了Transformer。新架構不僅保證了高效的訓...

2年前 (2024)

作者 |Timothée Lacroix OneFlow編譯翻譯｜宛子琳、楊婷選擇正確的 LLM 推理棧意味著選擇適合你的任務的正確模型，并配以適當的推理代碼在適當的硬件上運行...

2年前 (2024)

機器之心報道編輯：陳萍、小舟Stable Code 3B 的性能優于類似大小的代碼模型，并且與 CodeLLaMA 7B 的性能相當，盡管其大小只有 CodeLLaMA 7B 的 40%。在文...

2年前 (2024)

機器之心報道編輯：杜偉、小舟這是為數不多深入比較使用消費級 GPU（RTX 3090、4090）和服務器顯卡（A800）進行大模型預訓練、微調和推理的論文。大型語言...

2年前 (2023)

來源：PaperWeekly作者：陳樂群學校：華盛頓大學博士生研究方向：機器學習系統及分布式系統機器學習模型依賴于批處理（Batching）來提高推斷吞吐量，尤其是...

2年前 (2023)

作者：英特爾公司沈海豪、羅嶼、孟恒宇、董波、林俊編者按：只需不到9行代碼，就能在CPU上實現出色的LLM推理性能。英特爾?Extension for Transformer創新工...

2年前 (2023)