標(biāo)簽:參數(shù)

WPS接入DeepSeek,秒變辦公神器!

WPS 大家經(jīng)常用來日常寫作,雖然本身提供了AI功能,但可惜需要會員,本文教你三分鐘接入最火的DeepSeek,讓W(xué)PS秒變辦公神器。 DeepSeek API申請地址:http:/...
閱讀原文

AI賺錢副業(yè)~AI生成影視解說,半個(gè)月漲粉變現(xiàn)3.5W+!

這兩年大家都在感嘆生活不易,然而我想說的是,機(jī)會還是有的,但問題不在于有沒有,而在于你是否能夠認(rèn)準(zhǔn)機(jī)會,然后抓住它。 接觸過很多咨詢項(xiàng)目的人,發(fā)現(xiàn)...

Scaling Law或?qū)⒔K結(jié)?哈佛MIT預(yù)警:低精度量化已無路可走,重磅研究掀翻AI圈

新智元報(bào)道編輯:桃子 LRS 【新智元導(dǎo)讀】哈佛斯坦福MIT等機(jī)構(gòu)首次提出「精度感知」scaling law,揭示了精度、參數(shù)規(guī)模、數(shù)據(jù)量之間的統(tǒng)一關(guān)系。數(shù)據(jù)量增加,...
閱讀原文

Token化一切,甚至網(wǎng)絡(luò)!北大&谷歌&馬普所提出TokenFormer,Transformer從來沒有這么靈活過!

AIxiv專欄是機(jī)器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過去數(shù)年,機(jī)器之心AIxiv專欄接收報(bào)道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級實(shí)驗(yàn)室,有效促進(jìn)了學(xué)術(shù)...
閱讀原文

首個(gè)多模態(tài)連續(xù)學(xué)習(xí)綜述,港中文、清華、UIC聯(lián)合發(fā)布

AIxiv專欄是機(jī)器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過去數(shù)年,機(jī)器之心AIxiv專欄接收報(bào)道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級實(shí)驗(yàn)室,有效促進(jìn)了學(xué)術(shù)...
閱讀原文

finetune后的模型參數(shù),還可以繼續(xù)怎么玩?

大會預(yù)告12月5日-6日,2024中國生成式AI大會(上海站)將舉辦。上海科大助理教授、博導(dǎo)顧家遠(yuǎn),騰訊優(yōu)圖實(shí)驗(yàn)室天衍研究中心負(fù)責(zé)人吳賢,銀河通用機(jī)器人合伙人...
閱讀原文

從能量角度看AI模型訓(xùn)練過程

說 AI 模型訓(xùn)練之前先說個(gè)引子。 人體消耗能量最多的器官是大腦,人腦幾乎每時(shí)每刻都在消耗能量進(jìn)行思考活動(dòng),甚至睡覺的時(shí)候都停不下來。 與人體大腦能量消...
閱讀原文

有生命的AI?AI Agent的應(yīng)用可不只游戲NPC|對話超參數(shù)科技

視點(diǎn) 發(fā)自 凹非寺量子位|公眾號 QbitAIAI與游戲一直以來都是相輔相成的關(guān)系。 過去,AI在游戲中不斷訓(xùn)練升級,電子游戲、象棋、圍棋都曾是AI的訓(xùn)練場。如今...
閱讀原文

微軟開源爆火1.58bit大模型推理框架!千億參數(shù)模型量化后單CPU可跑,速度每秒5-7個(gè)token

西風(fēng) 發(fā)自 凹非寺量子位 | 公眾號 QbitAI微軟開源1bit大模型推理框架! 現(xiàn)在1000億參數(shù)大模型量化后單CPU可跑,速度可達(dá)每秒5-7個(gè)token。 比如在蘋果M2新品上...
閱讀原文

NeurIPS 2024 Oral | 小參數(shù),大作為!揭秘非對稱 LoRA 架構(gòu)的高效性能

AIxiv專欄是機(jī)器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過去數(shù)年,機(jī)器之心AIxiv專欄接收報(bào)道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級實(shí)驗(yàn)室,有效促進(jìn)了學(xué)術(shù)...
閱讀原文

Jurgen、曼寧等大佬新作:MoE重塑6年前的Universal Transformer,高效升級

機(jī)器之心報(bào)道 編輯:杜偉、蛋醬7 年前,谷歌在論文《Attention is All You Need》中提出了 Transformer。就在 Transformer 提出的第二年,谷歌又發(fā)布了 Unive...
閱讀原文

沖出“包圍圈”,階躍星辰登頂國內(nèi)多模態(tài)理解大模型榜首

說起階躍星辰,可以說是 AI 六小強(qiáng)中最低調(diào)的一個(gè),但最近這家公司在 AI 圈里頻頻“鬧出動(dòng)靜”。 前幾天,中文大模型基準(zhǔn)測評機(jī)構(gòu) SuperCLUE 發(fā)布了 10 月中文...
閱讀原文

學(xué)生最偉大的新研究!書里的斜坡實(shí)驗(yàn)、透鏡變化規(guī)律用AI都動(dòng)起來了

夕小瑤科技說 分享來源 | 機(jī)器之心原來物理還能這么學(xué)。 學(xué)習(xí)物理,不同的人自然有不同的經(jīng)歷。一些人覺得物理課簡單直觀,但另一些人卻認(rèn)為它抽象又反直覺,...
閱讀原文

OpenAI今天Open了一下:開源多智能體框架Swarm

夕小瑤科技說 分享來源 | 機(jī)器之心毫無疑問,多智能體肯定是 OpenAI 未來重要的研究方向之一,前些天 OpenAI 著名研究科學(xué)家 Noam Brown還在 X 上為 OpenAI ...
閱讀原文

NeurIPS 2024 | 大模型的詞表大小,同樣適用于Scaling Law

AIxiv專欄是機(jī)器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過去數(shù)年,機(jī)器之心AIxiv專欄接收報(bào)道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級實(shí)驗(yàn)室,有效促進(jìn)了學(xué)術(shù)...
閱讀原文

微調(diào)大模型,AMD MI300X就夠了!跟著這篇博客微調(diào)Llama 3.1 405B,效果媲美H100

機(jī)器之心報(bào)道 機(jī)器之心編輯部隨著 AI 模型的參數(shù)量越來越大,對算力的需求也水漲船高。 比如最近,Llama-3.1 登上了最強(qiáng)開源大模型的寶座,但超大杯 405B 版...
閱讀原文

圖解大模型訓(xùn)練之:數(shù)據(jù)并行上篇(DP, DDP與ZeRO)

GTIC 2024中國AI PC創(chuàng)新峰會將于10月11日,在2024上海國際消費(fèi)電子展TechG同期舉辦。聯(lián)想集團(tuán)首席研究員顏毅強(qiáng)、榮耀終端有限公司PC產(chǎn)品研發(fā)系統(tǒng)部部長席迎軍...
閱讀原文
12316