標簽:損失
何愷明謝賽寧解剖擴散模型,新作剛剛出爐
編輯部 發自 凹非寺量子位 | 公眾號 QbitAICV大神何愷明,也來搞擴散模型(Diffusion Model)了! 大神最新論文剛剛掛上arXiv,還是熱乎的:解構擴散模型,提...
三行代碼無損加速40%,尤洋團隊AI訓練加速器入選ICLR Oral論文
克雷西 發自 凹非寺量子位 | 公眾號 QbitAI用剪枝的方式加速AI訓練,也能實現無損操作了,只要三行代碼就能完成! 今年的深度學習頂會ICLR上,新加坡國立大學...
彌合2D和3D生成領域之間的次元壁,X-Dreamer實現高質量的文本到3D生成
機器之心專欄機器之心編輯部本文介紹了一個名為 X-Dreamer 的框架,它主要由CG-LoRA和AMA損失兩種關鍵創新組成,實現了彌合 text-to-2D 和 text-to-3D 間的領...
更通用、有效,螞蟻自研優化器WSAM入選KDD Oral
機器之心專欄機器之心編輯部螞蟻 AI Infra 團隊在深度學習最核心之一的優化器方向持續投入與創新,實現了 AI 訓練節約資源、加速收斂、提升泛化等目標。我們...
Chinchilla之死:只要訓練足夠長時間,小模型也能超過大模型
選自espadrine機器之心編譯2022 年 3 月,DeepMind 一篇論文《Training Compute-Optimal Large Language Models》通過構建的 Chinchilla 模型得出了一個結論...
12