標簽:權重

發布幾小時,微軟秒刪媲美GPT-4開源大模型!竟因忘記投毒測試

新智元報道編輯:編輯部 【新智元導讀】前段時間,微軟公布并開源了最新一代大模型WizardLM-2,號稱性能堪比GPT-4。不過,還未上線一天,模型權重和公告全被...
閱讀原文

生成式AI如何告別、版權困擾?基于權重顯著性的機器遺忘算法有奇效

AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
閱讀原文

無向圖最小割問題取得新突破,谷歌研究獲SODA 2024最佳論文獎

機器之心報道 機器之心編輯部谷歌博客放出新研究,求解無向圖的最小割問題。1996 年, 美國計算機科學家 David R Karger 連同其他研究者在論文《 A new appro...
閱讀原文

DeepMind升級Transformer,前向通過FLOPs最多可降一半

機器之心報道 編輯:Panda W引入混合深度,DeepMind 新設計可大幅提升 Transformer 效率。Transformer 的重要性無需多言,目前也有很多研究團隊致力于改進這...
閱讀原文

前OpenAI大神Karpathy再整活,1000行C代碼搞定GPT-2訓練,網友:C語言復興了!

智猩猩與智東西將于4月18-19日在北京共同舉辦2024中國生成式AI大會,愛詩科技創始人兼CEO王長虎,Open-Sora開發團隊潞晨科技創始人尤洋,英偉達解決方案架構...
閱讀原文

1000行C語言搓出GPT-2!AI大神Karpathy新項目剛上線就狂攬2.5k星

新智元報道編輯:桃子 好困 【新智元導讀】訓大模型的方法可能要被革新了!AI大神Karpathy發布的新項目僅用1000行的C語言訓完GPT-2,而不再依賴龐大的GPT-2庫...
閱讀原文

純C語言手搓GPT-2,前OpenAI、特斯拉高管新項目火了

機器之心報道 編輯:澤南、小舟「Real men program in C.」眾所周知,大語言模型還在快速發展,應該有很多可以優化的地方。我用純 C 語言來寫,是不是能優化...
閱讀原文

CVPR 2024 | 分割一切模型SAM泛化能力差?域適應策略給解決了

機器之心專欄 機器之心編輯部第一個針對「Segment Anything」大模型的域適應策略來了!相關論文已被CVPR 2024 接收。引言 大語言模型(LLMs)的成功激發了計...
閱讀原文

Mistral CEO 紅杉美國分享:五年后,任何人都能創建 AI 自主代理,開發者與用戶界限變得模糊

以下文章來源于有新Newin,作者有新智猩猩與智東西將于4月18-19日在北京共同舉辦2024中國生成式AI大會,愛詩科技創始人王長虎,啟明創投合伙人周志峰,Open-S...
閱讀原文

突發:馬斯克Grok開源!

全球最大開源大模型!馬斯克Grok-1參數量3410億,正式開源。 作者|云鵬 編輯|心緣 6個月掏出3410億參數自研大模型,馬斯克說到做到! 智東西3月18日消息,就...
閱讀原文

GPT-4級模型Grok開源可商用!卷底層大模型的公司危了

夕小瑤科技說 原創作者 | 醒醒上周,馬斯克宣布 xAI 將開源 Grok。 剛剛,馬斯克終于兌現諾言,xAI 宣布開源了 Grok-1 的模型權重和網絡架構。 Grok-1 是一個...
閱讀原文

馬斯克打臉OpenAI,全球最大巨無霸模型Grok-1開源!3140億參數8個MoE,GitHub狂攬6k星

新智元報道編輯:編輯部 【新智元導讀】xAI的Grok,在七天后如期開源了!公開Grok背后代碼,讓馬斯克對OpenAI啪啪打臉。3140億參數8個MoE,權重架構全開放,...
閱讀原文

馬斯克開源Grok-1:3140億參數迄今最大,權重架構全開放,磁力下載

機器之心報道 機器之心編輯部開源社區有福了。 說到做到,馬斯克承諾的開源版大模型 Grok 終于來了! 今天凌晨,馬斯克旗下大模型公司 xAI 宣布正式開源 3140...
閱讀原文

馬斯克開源Grok:參數量近ChatGPT兩倍,成為最強開源模型

點擊上方藍字關注我們“埃隆·馬斯克領導的xAI公司開源了其首個大型語言模型Grok,擁有3140億參數。該舉措挑戰了AI領域的現有格局,向其他競爭對手施加了壓力。...
閱讀原文

手機、PC輕松跑大模型!谷歌發最新API,28億參數模型本地跑

安卓霸主出手!讓大模型輕松跑在手機上,四大模型可用。 編譯|李水青 編輯|云鵬 智東西3月8日報道,昨晚,谷歌正式發布了MediaPipe LLM Inference API,該API...
閱讀原文
1345678