標(biāo)簽:參數(shù)
能煉10萬(wàn)億參數(shù)模型!黃仁勛發(fā)布全新架構(gòu)GPU,性能提升30倍,H100已成過(guò)去時(shí)
GTC 2024 來(lái)了。 在今天凌晨的發(fā)布會(huì)上,英偉達(dá) CEO 黃仁勛發(fā)布了新的 AI 芯片,繼 Ampere A100、Hopper H100 芯片之后新產(chǎn)品——Blackwell B200,專為超大參數(shù)...
老黃祭出新B200!30倍H100單機(jī)可訓(xùn)15個(gè)GPT-4模型,AI迎新摩爾時(shí)代
新智元報(bào)道編輯:編輯部 【新智元導(dǎo)讀】就在剛剛,老黃又來(lái)打破摩爾定律了:英偉達(dá)新核彈B200,一塊能頂5個(gè)H100,30倍推理加速,能訓(xùn)萬(wàn)億參數(shù)大模型!同時(shí)推...
馬斯克正式開源 Grok-1,成為全球最大的開源大模型
開源了 但又沒 完全開源今日凌晨,在一片質(zhì)疑聲中,信守承諾的馬斯克卡在最后一日正式開源了 GroK。 好消息是, 馬斯克開源了 Grok 1.0 的完整代碼,壞消息是...
突發(fā):馬斯克Grok開源!
全球最大開源大模型!馬斯克Grok-1參數(shù)量3410億,正式開源。 作者|云鵬 編輯|心緣 6個(gè)月掏出3410億參數(shù)自研大模型,馬斯克說(shuō)到做到! 智東西3月18日消息,就...
馬斯克突然開源Grok:3140億參數(shù)巨無(wú)霸,免費(fèi)可商用
魚羊 克雷西 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI馬斯克說(shuō)到做到: 旗下大模型Grok現(xiàn)已開源! 代碼和模型權(quán)重已上線GitHub。官方信息顯示,此次開源的Grok-1是...
GPT-4級(jí)模型Grok開源可商用!卷底層大模型的公司危了
夕小瑤科技說(shuō) 原創(chuàng)作者 | 醒醒上周,馬斯克宣布 xAI 將開源 Grok。 剛剛,馬斯克終于兌現(xiàn)諾言,xAI 宣布開源了 Grok-1 的模型權(quán)重和網(wǎng)絡(luò)架構(gòu)。 Grok-1 是一個(gè)...
馬斯克打臉OpenAI,全球最大巨無(wú)霸模型Grok-1開源!3140億參數(shù)8個(gè)MoE,GitHub狂攬6k星
新智元報(bào)道編輯:編輯部 【新智元導(dǎo)讀】xAI的Grok,在七天后如期開源了!公開Grok背后代碼,讓馬斯克對(duì)OpenAI啪啪打臉。3140億參數(shù)8個(gè)MoE,權(quán)重架構(gòu)全開放,...
巧解「數(shù)據(jù)稀缺」問(wèn)題!清華開源GPD:用擴(kuò)散模型生成神經(jīng)網(wǎng)絡(luò)參數(shù)|ICLR 2024
新智元報(bào)道編輯:LRS 好困 【新智元導(dǎo)讀】清華大學(xué)電子工程系城市科學(xué)與計(jì)算研究中心最近提出了一種新的時(shí)空少樣本學(xué)習(xí)方法,旨在解決城市計(jì)算中廣泛存在的數(shù)...
馬斯克開源Grok-1:3140億參數(shù)迄今最大,權(quán)重架構(gòu)全開放,磁力下載
機(jī)器之心報(bào)道 機(jī)器之心編輯部開源社區(qū)有福了。 說(shuō)到做到,馬斯克承諾的開源版大模型 Grok 終于來(lái)了! 今天凌晨,馬斯克旗下大模型公司 xAI 宣布正式開源 3140...
馬斯克開源Grok:參數(shù)量近ChatGPT兩倍,成為最強(qiáng)開源模型
點(diǎn)擊上方藍(lán)字關(guān)注我們“埃隆·馬斯克領(lǐng)導(dǎo)的xAI公司開源了其首個(gè)大型語(yǔ)言模型Grok,擁有3140億參數(shù)。該舉措挑戰(zhàn)了AI領(lǐng)域的現(xiàn)有格局,向其他競(jìng)爭(zhēng)對(duì)手施加了壓力。...
4萬(wàn)億晶體管5nm制程,全球最快AI芯片碾壓H100!單機(jī)可訓(xùn)24萬(wàn)億參數(shù)LLM,Llama 70B一天搞定
新智元報(bào)道編輯:桃子 好困 【新智元導(dǎo)讀】AI世界的進(jìn)化快的有點(diǎn)跟不上了。剛剛,全球最強(qiáng)最大AI芯片WSE-3發(fā)布,4萬(wàn)億晶體管5nm工藝制程。更厲害的是,WSE-3...
4萬(wàn)億個(gè)晶體管,單機(jī)可訓(xùn)練比GPT4大10倍的模型,最快最大的芯片面世
機(jī)器之心報(bào)道 編輯:小舟、陳萍剛剛,芯片創(chuàng)業(yè)公司 Cerebras 宣布了該公司歷史上最重要的消息,「我們發(fā)布了世界上最快的芯片,該芯片擁有高達(dá) 4 萬(wàn)億個(gè)晶體...
ICLR 2024 Spotlight | 大語(yǔ)言模型權(quán)重、激活的全方位低bit可微量化,已集成進(jìn)商用APP
機(jī)器之心專欄 作者:邵文琪模型量化是模型壓縮與加速中的一項(xiàng)關(guān)鍵技術(shù),其將模型權(quán)重與激活值量化至低 bit,以允許模型占用更少的內(nèi)存開銷并加快推理速度。對(duì)...
一網(wǎng)打盡!深度學(xué)習(xí)常見問(wèn)題!
大數(shù)據(jù)文摘受權(quán)轉(zhuǎn)載自算法進(jìn)階 1 前言 在傳統(tǒng)軟件工程中,程序問(wèn)題(即Bugs)會(huì)導(dǎo)致程序崩潰,但開發(fā)人員可以通過(guò)檢查錯(cuò)誤來(lái)了解原因。 然而,在深度學(xué)習(xí)中,...
關(guān)于scaling law 的正確認(rèn)識(shí)
智猩猩和智東西發(fā)起主辦的2024中國(guó)生成式AI大會(huì)將于4月18-19日在北京舉辦。主會(huì)場(chǎng)將進(jìn)行開幕式、大模型專場(chǎng)、AI Infra專場(chǎng)和AIGC應(yīng)用專場(chǎng);分會(huì)場(chǎng)將進(jìn)行具身...
粵公網(wǎng)安備 44011502001135號(hào)