標(biāo)簽：參數(shù)

挑戰(zhàn)Scaling Law，Meta發(fā)布移動(dòng)端350M小模型MobileLLM，性能比肩7B LLaMA-v2

新智元報(bào)道編輯：?jiǎn)虠?【新智元導(dǎo)讀】Scaling Law還沒(méi)走到盡頭，「小模型」逐漸成為科技巨頭們的追趕趨勢(shì)。Meta最近發(fā)布的MobileLLM系列，規(guī)模甚至降低到了1B...

閱讀原文

AIGC動(dòng)態(tài)

1年前 (2024)

OpenAI 終于發(fā)布 GPT-4o mini，但比中國(guó)大模型晚了半年

OpenAI 的入局，更加驗(yàn)證了“小”模型的未來(lái)價(jià)值。作者 | 朱可軒、西西編輯 | 陳彩嫻美國(guó)時(shí)間 7 月18 日，OpenAI 正式發(fā)布了多模態(tài)小模型 GPT-4o mini，在海...

閱讀原文

AIGC動(dòng)態(tài)

1年前 (2024)

基于華為昇騰推理引擎MindIE部署Qwen-72B實(shí)戰(zhàn)

在華為昇騰LLM落地可選解決方案中，我們?cè)榻B過(guò)MindIE，并且前段時(shí)間MindIE 1.0.RC1已經(jīng)發(fā)布，本文主要將對(duì)其進(jìn)行實(shí)戰(zhàn)演練。 01MindIE 簡(jiǎn)介MindIE（Mind Inf...

閱讀原文

AIGC動(dòng)態(tài)

1年前 (2024)

30B！每秒100tokens！這是AMD對(duì)AI PC的“幻想時(shí)間”

夕小瑤科技說(shuō) 原創(chuàng)作者 | 谷雨龍澤隨著AI的高速發(fā)展，從去年開(kāi)始，掛在服務(wù)器的云端AI模型已經(jīng)不能滿足技術(shù)發(fā)燒友的胃口了，AI PC應(yīng)運(yùn)而生。 AI PC就是內(nèi)嵌個(gè)...

閱讀原文

AIGC動(dòng)態(tài)

1年前 (2024)

MoE也有Scaling Law，「百萬(wàn)專家」利用率近100%！DeepMind華人挑戰(zhàn)MoE極限

新智元報(bào)道編輯：編輯部【新智元導(dǎo)讀】MoE已然成為AI界的主流架構(gòu)，不論是開(kāi)源Grok，還是閉源GPT-4，皆是其擁躉。然而，這些模型的專家，最大數(shù)量?jī)H有32個(gè)。...

閱讀原文

AIGC動(dòng)態(tài)

1年前 (2024)

快速遷移大模型到昇騰910B保姆級(jí)教程（Pytorch版）

7月11日19點(diǎn)，「智猩猩自動(dòng)駕駛新青年講座」第36講將開(kāi)講，主講理想汽車最新成果：基于MLLM的閉環(huán)規(guī)劃智能體PlanAgent，由理想汽車實(shí)習(xí)研究員、中國(guó)科學(xué)院自...

閱讀原文

AIGC動(dòng)態(tài)

1年前 (2024)

Meta AI推出適用于移動(dòng)設(shè)備的緊湊型語(yǔ)言模型

點(diǎn)擊上方藍(lán)字關(guān)注我們“Meta AI 推出 MobileLLM，一種為移動(dòng)設(shè)備設(shè)計(jì)的高效語(yǔ)言模型。該模型通過(guò)優(yōu)化參數(shù)，實(shí)現(xiàn)了與更大模型相當(dāng)?shù)男阅埽苿?dòng)了 AI 模型小型化...

閱讀原文

AIGC動(dòng)態(tài)

1年前 (2024)

院士領(lǐng)銜推出大模型的第3種記憶：比參數(shù)存儲(chǔ)和RAG都便宜，2.4B模型越級(jí)打13B

夢(mèng)晨發(fā)自凹非寺量子位 | 公眾號(hào) QbitAI給大模型加上第三種記憶格式，把寶貴的參數(shù)從死記硬背知識(shí)中解放出來(lái)！中科院院士鄂維南領(lǐng)銜，上海算法創(chuàng)新研究院等...

閱讀原文

AIGC動(dòng)態(tài)

1年前 (2024)

又一家技術(shù)+產(chǎn)品雙殺的大模型創(chuàng)業(yè)公司！一款測(cè)試，讓其WAIC大會(huì)展位火爆

夕小瑤科技說(shuō) 原創(chuàng)作者 | 夕小瑤編輯部最近上海世界人工智能大會(huì)（WAIC）現(xiàn)場(chǎng)，一個(gè)國(guó)風(fēng)展位前排起了長(zhǎng)長(zhǎng)的隊(duì)伍，筆者忍不住好奇，究竟是什么新奇的東西吸引...

閱讀原文

AIGC動(dòng)態(tài)

1年前 (2024)

參數(shù)更新量?jī)H為L(zhǎng)oRA的5%，性能不減反升！南加大提出高效精調(diào)法LaMDA

夕小瑤科技說(shuō) 原創(chuàng)作者 | Axe_越萬(wàn)物負(fù)陰而抱陽(yáng)，沖氣以為和 ——《道德經(jīng)·第四十二章》從Bert時(shí)代一路過(guò)來(lái)的朋友們應(yīng)該還記得，對(duì)于僅僅只有1億參數(shù)的Bert，...

閱讀原文

AIGC動(dòng)態(tài)

1年前 (2024)

Adam有了mini版：內(nèi)存占用少一半，吞吐量提升50%

機(jī)器之心報(bào)道編輯：panda在訓(xùn)練大型語(yǔ)言模型（LLM）時(shí)，Adam(W) 基本上已經(jīng)成為了人們默認(rèn)使用的優(yōu)化器。 Adam 盡管性能優(yōu)異，但使用成本很高。具體來(lái)說(shuō)，Ad...

閱讀原文

AIGC動(dòng)態(tài)

1年前 (2024)

今天，階躍星辰正式發(fā)布萬(wàn)億MoE大模型｜甲子光年

國(guó)產(chǎn)大模型跑出了“階躍速度”。作者｜趙健今年的世界人工智能大會(huì)（WAIC），“大模型”含量極高，既有已發(fā)布模型的集中展示，也有大模型的首發(fā)亮相。其中，階...

閱讀原文

AIGC動(dòng)態(tài)

1年前 (2024)

階躍星辰首發(fā)「萬(wàn)億」和「多模」大模型，還與《大鬧天宮》跨界聯(lián)動(dòng) | WAIC 2024

階躍星辰再出王炸僅僅過(guò)去 100 天左右，站在 AGI 風(fēng)口上的階躍星辰再次亮出王炸成果。在今天揭幕的世界人工智能大會(huì)，階躍星辰宣布對(duì) Step 系列通用大模型...

閱讀原文

AIGC動(dòng)態(tài)

1年前 (2024)

如何通往AGI？階躍星辰用萬(wàn)億+多模交卷，三大模型亮相WAIC

微軟前高管創(chuàng)業(yè)AGI，大模型創(chuàng)企“五虎”變“六杰”。作者|香草編輯|漠影隨著大模型的智能水平迅速增長(zhǎng)，科技圈對(duì)AGI（通用人工智能）將于幾年內(nèi)降臨的預(yù)測(cè)聲音...

閱讀原文

AIGC動(dòng)態(tài)

1年前 (2024)

上海WAIC大會(huì)現(xiàn)場(chǎng)“大鬧天宮”：模型夠猛，產(chǎn)品夠酷，公司夠強(qiáng)

衡宇發(fā)自凹非寺量子位 | 公眾號(hào) QbitAI今年上海世界人工智能大會(huì)，誰(shuí)最受關(guān)注？展區(qū)現(xiàn)場(chǎng)，有個(gè)擠得水泄不通的互動(dòng)—— 像孫猴子一樣在全世界大鬧天宮的AI大...

閱讀原文

AIGC動(dòng)態(tài)

1年前 (2024)

1 2 345 6…16