標(biāo)簽：參數(shù)

能煉10萬(wàn)億參數(shù)模型！黃仁勛發(fā)布全新架構(gòu)GPU，性能提升30倍，H100已成過(guò)去時(shí)

GTC 2024 來(lái)了。在今天凌晨的發(fā)布會(huì)上，英偉達(dá) CEO 黃仁勛發(fā)布了新的 AI 芯片，繼 Ampere A100、Hopper H100 芯片之后新產(chǎn)品——Blackwell B200，專為超大參數(shù)...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2024)

老黃祭出新B200！30倍H100單機(jī)可訓(xùn)15個(gè)GPT-4模型，AI迎新摩爾時(shí)代

新智元報(bào)道編輯：編輯部【新智元導(dǎo)讀】就在剛剛，老黃又來(lái)打破摩爾定律了：英偉達(dá)新核彈B200，一塊能頂5個(gè)H100，30倍推理加速，能訓(xùn)萬(wàn)億參數(shù)大模型！同時(shí)推...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2024)

馬斯克正式開源 Grok-1，成為全球最大的開源大模型

開源了但又沒完全開源今日凌晨，在一片質(zhì)疑聲中，信守承諾的馬斯克卡在最后一日正式開源了 GroK。好消息是，馬斯克開源了 Grok 1.0 的完整代碼，壞消息是...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2024)

突發(fā)：馬斯克Grok開源！

全球最大開源大模型！馬斯克Grok-1參數(shù)量3410億，正式開源。作者|云鵬編輯|心緣 6個(gè)月掏出3410億參數(shù)自研大模型，馬斯克說(shuō)到做到！智東西3月18日消息，就...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2024)

馬斯克突然開源Grok：3140億參數(shù)巨無(wú)霸，免費(fèi)可商用

魚羊克雷西發(fā)自凹非寺量子位 | 公眾號(hào) QbitAI馬斯克說(shuō)到做到：旗下大模型Grok現(xiàn)已開源！代碼和模型權(quán)重已上線GitHub。官方信息顯示，此次開源的Grok-1是...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2024)

GPT-4級(jí)模型Grok開源可商用！卷底層大模型的公司危了

夕小瑤科技說(shuō) 原創(chuàng)作者 | 醒醒上周，馬斯克宣布 xAI 將開源 Grok。剛剛，馬斯克終于兌現(xiàn)諾言，xAI 宣布開源了 Grok-1 的模型權(quán)重和網(wǎng)絡(luò)架構(gòu)。 Grok-1 是一個(gè)...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2024)

馬斯克打臉OpenAI，全球最大巨無(wú)霸模型Grok-1開源！3140億參數(shù)8個(gè)MoE，GitHub狂攬6k星

新智元報(bào)道編輯：編輯部【新智元導(dǎo)讀】xAI的Grok，在七天后如期開源了！公開Grok背后代碼，讓馬斯克對(duì)OpenAI啪啪打臉。3140億參數(shù)8個(gè)MoE，權(quán)重架構(gòu)全開放，...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2024)

巧解「數(shù)據(jù)稀缺」問(wèn)題！清華開源GPD：用擴(kuò)散模型生成神經(jīng)網(wǎng)絡(luò)參數(shù)｜ICLR 2024

新智元報(bào)道編輯：LRS 好困【新智元導(dǎo)讀】清華大學(xué)電子工程系城市科學(xué)與計(jì)算研究中心最近提出了一種新的時(shí)空少樣本學(xué)習(xí)方法，旨在解決城市計(jì)算中廣泛存在的數(shù)...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2024)

馬斯克開源Grok-1：3140億參數(shù)迄今最大，權(quán)重架構(gòu)全開放，磁力下載

機(jī)器之心報(bào)道機(jī)器之心編輯部開源社區(qū)有福了。說(shuō)到做到，馬斯克承諾的開源版大模型 Grok 終于來(lái)了！今天凌晨，馬斯克旗下大模型公司 xAI 宣布正式開源 3140...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2024)

馬斯克開源Grok：參數(shù)量近ChatGPT兩倍，成為最強(qiáng)開源模型

點(diǎn)擊上方藍(lán)字關(guān)注我們“埃隆·馬斯克領(lǐng)導(dǎo)的xAI公司開源了其首個(gè)大型語(yǔ)言模型Grok，擁有3140億參數(shù)。該舉措挑戰(zhàn)了AI領(lǐng)域的現(xiàn)有格局，向其他競(jìng)爭(zhēng)對(duì)手施加了壓力。...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2024)

4萬(wàn)億晶體管5nm制程，全球最快AI芯片碾壓H100！單機(jī)可訓(xùn)24萬(wàn)億參數(shù)LLM，Llama 70B一天搞定

新智元報(bào)道編輯：桃子好困【新智元導(dǎo)讀】AI世界的進(jìn)化快的有點(diǎn)跟不上了。剛剛，全球最強(qiáng)最大AI芯片WSE-3發(fā)布，4萬(wàn)億晶體管5nm工藝制程。更厲害的是，WSE-3...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2024)

4萬(wàn)億個(gè)晶體管，單機(jī)可訓(xùn)練比GPT4大10倍的模型，最快最大的芯片面世

機(jī)器之心報(bào)道編輯：小舟、陳萍剛剛，芯片創(chuàng)業(yè)公司 Cerebras 宣布了該公司歷史上最重要的消息，「我們發(fā)布了世界上最快的芯片，該芯片擁有高達(dá) 4 萬(wàn)億個(gè)晶體...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2024)

ICLR 2024 Spotlight | 大語(yǔ)言模型權(quán)重、激活的全方位低bit可微量化，已集成進(jìn)商用APP

機(jī)器之心專欄作者：邵文琪模型量化是模型壓縮與加速中的一項(xiàng)關(guān)鍵技術(shù)，其將模型權(quán)重與激活值量化至低 bit，以允許模型占用更少的內(nèi)存開銷并加快推理速度。對(duì)...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2024)

一網(wǎng)打盡！深度學(xué)習(xí)常見問(wèn)題！

大數(shù)據(jù)文摘受權(quán)轉(zhuǎn)載自算法進(jìn)階 1 前言在傳統(tǒng)軟件工程中，程序問(wèn)題（即Bugs）會(huì)導(dǎo)致程序崩潰，但開發(fā)人員可以通過(guò)檢查錯(cuò)誤來(lái)了解原因。然而，在深度學(xué)習(xí)中，...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2024)

關(guān)于scaling law 的正確認(rèn)識(shí)

智猩猩和智東西發(fā)起主辦的2024中國(guó)生成式AI大會(huì)將于4月18-19日在北京舉辦。主會(huì)場(chǎng)將進(jìn)行開幕式、大模型專場(chǎng)、AI Infra專場(chǎng)和AIGC應(yīng)用專場(chǎng)；分會(huì)場(chǎng)將進(jìn)行具身...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2024)

1…8 91011 12…16