標(biāo)簽:參數(shù)

挑戰(zhàn)Scaling Law,Meta發(fā)布移動(dòng)端350M小模型MobileLLM,性能比肩7B LLaMA-v2

新智元報(bào)道編輯:?jiǎn)虠?【新智元導(dǎo)讀】Scaling Law還沒(méi)走到盡頭,「小模型」逐漸成為科技巨頭們的追趕趨勢(shì)。Meta最近發(fā)布的MobileLLM系列,規(guī)模甚至降低到了1B...
閱讀原文

OpenAI 終于發(fā)布 GPT-4o mini,但比中國(guó)大模型晚了半年

OpenAI 的入局,更加驗(yàn)證了“小”模型的未來(lái)價(jià)值。作者 | 朱可軒、西西 編輯 | 陳彩嫻 美國(guó)時(shí)間 7 月18 日,OpenAI 正式發(fā)布了多模態(tài)小模型 GPT-4o mini,在海...
閱讀原文

基于華為昇騰推理引擎MindIE部署Qwen-72B實(shí)戰(zhàn)

在華為昇騰LLM落地可選解決方案中,我們?cè)榻B過(guò)MindIE,并且前段時(shí)間MindIE 1.0.RC1已經(jīng)發(fā)布,本文主要將對(duì)其進(jìn)行實(shí)戰(zhàn)演練。 01MindIE 簡(jiǎn)介MindIE(Mind Inf...
閱讀原文

30B!每秒100tokens!這是AMD對(duì)AI PC的“幻想時(shí)間”

夕小瑤科技說(shuō) 原創(chuàng)作者 | 谷雨龍澤隨著AI的高速發(fā)展,從去年開(kāi)始,掛在服務(wù)器的云端AI模型已經(jīng)不能滿足技術(shù)發(fā)燒友的胃口了,AI PC應(yīng)運(yùn)而生。 AI PC就是內(nèi)嵌個(gè)...
閱讀原文

MoE也有Scaling Law,「百萬(wàn)專家」利用率近100%!DeepMind華人挑戰(zhàn)MoE極限

新智元報(bào)道編輯:編輯部 【新智元導(dǎo)讀】MoE已然成為AI界的主流架構(gòu),不論是開(kāi)源Grok,還是閉源GPT-4,皆是其擁躉。然而,這些模型的專家,最大數(shù)量?jī)H有32個(gè)。...
閱讀原文

快速遷移大模型到昇騰910B保姆級(jí)教程(Pytorch版)

7月11日19點(diǎn),「智猩猩自動(dòng)駕駛新青年講座」第36講將開(kāi)講,主講理想汽車最新成果:基于MLLM的閉環(huán)規(guī)劃智能體PlanAgent,由理想汽車實(shí)習(xí)研究員、中國(guó)科學(xué)院自...
閱讀原文

Meta AI推出適用于移動(dòng)設(shè)備的緊湊型語(yǔ)言模型

點(diǎn)擊上方藍(lán)字關(guān)注我們“Meta AI 推出 MobileLLM,一種為移動(dòng)設(shè)備設(shè)計(jì)的高效語(yǔ)言模型。該模型通過(guò)優(yōu)化參數(shù),實(shí)現(xiàn)了與更大模型相當(dāng)?shù)男阅埽苿?dòng)了 AI 模型小型化...
閱讀原文

院士領(lǐng)銜推出大模型的第3種記憶:比參數(shù)存儲(chǔ)和RAG都便宜,2.4B模型越級(jí)打13B

夢(mèng)晨 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI給大模型加上第三種記憶格式,把寶貴的參數(shù)從死記硬背知識(shí)中解放出來(lái)! 中科院院士鄂維南領(lǐng)銜,上海算法創(chuàng)新研究院等...
閱讀原文

又一家技術(shù)+產(chǎn)品雙殺的大模型創(chuàng)業(yè)公司!一款測(cè)試,讓其WAIC大會(huì)展位火爆

夕小瑤科技說(shuō) 原創(chuàng)作者 | 夕小瑤編輯部最近上海世界人工智能大會(huì)(WAIC)現(xiàn)場(chǎng),一個(gè)國(guó)風(fēng)展位前排起了長(zhǎng)長(zhǎng)的隊(duì)伍,筆者忍不住好奇,究竟是什么新奇的東西吸引...
閱讀原文

參數(shù)更新量?jī)H為L(zhǎng)oRA的5%,性能不減反升!南加大提出高效精調(diào)法LaMDA

夕小瑤科技說(shuō) 原創(chuàng)作者 | Axe_越萬(wàn)物負(fù)陰而抱陽(yáng),沖氣以為和 ——《道德經(jīng)·第四十二章》 從Bert時(shí)代一路過(guò)來(lái)的朋友們應(yīng)該還記得,對(duì)于僅僅只有1億參數(shù)的Bert,...
閱讀原文

Adam有了mini版:內(nèi)存占用少一半,吞吐量提升50%

機(jī)器之心報(bào)道 編輯:panda在訓(xùn)練大型語(yǔ)言模型(LLM)時(shí),Adam(W) 基本上已經(jīng)成為了人們默認(rèn)使用的優(yōu)化器。 Adam 盡管性能優(yōu)異,但使用成本很高。具體來(lái)說(shuō),Ad...
閱讀原文

今天,階躍星辰正式發(fā)布萬(wàn)億MoE大模型|甲子光年

國(guó)產(chǎn)大模型跑出了“階躍速度”。作者|趙健 今年的世界人工智能大會(huì)(WAIC),“大模型”含量極高,既有已發(fā)布模型的集中展示,也有大模型的首發(fā)亮相。 其中,階...
閱讀原文

階躍星辰首發(fā)「萬(wàn)億」和「多模」大模型,還與《大鬧天宮》跨界聯(lián)動(dòng) | WAIC 2024

階躍星辰 再出王炸僅僅過(guò)去 100 天左右,站在 AGI 風(fēng)口上的階躍星辰再次亮出王炸成果。 在今天揭幕的世界人工智能大會(huì),階躍星辰宣布對(duì) Step 系列通用大模型...
閱讀原文

如何通往AGI?階躍星辰用萬(wàn)億+多模交卷,三大模型亮相WAIC

微軟前高管創(chuàng)業(yè)AGI,大模型創(chuàng)企“五虎”變“六杰”。 作者|香草 編輯|漠影 隨著大模型的智能水平迅速增長(zhǎng),科技圈對(duì)AGI(通用人工智能)將于幾年內(nèi)降臨的預(yù)測(cè)聲音...
閱讀原文

上海WAIC大會(huì)現(xiàn)場(chǎng)“大鬧天宮”:模型夠猛,產(chǎn)品夠酷,公司夠強(qiáng)

衡宇 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI今年上海世界人工智能大會(huì),誰(shuí)最受關(guān)注? 展區(qū)現(xiàn)場(chǎng),有個(gè)擠得水泄不通的互動(dòng)—— 像孫猴子一樣在全世界大鬧天宮的AI大...
閱讀原文
12345616