標簽:參數
WPS接入DeepSeek,秒變辦公神器!
WPS 大家經常用來日常寫作,雖然本身提供了AI功能,但可惜需要會員,本文教你三分鐘接入最火的DeepSeek,讓WPS秒變辦公神器。 DeepSeek API申請地址:http:/...
AI賺錢副業~AI生成影視解說,半個月漲粉變現3.5W+!
這兩年大家都在感嘆生活不易,然而我想說的是,機會還是有的,但問題不在于有沒有,而在于你是否能夠認準機會,然后抓住它。 接觸過很多咨詢項目的人,發現...
Scaling Law或將終結?哈佛MIT預警:低精度量化已無路可走,重磅研究掀翻AI圈
新智元報道編輯:桃子 LRS 【新智元導讀】哈佛斯坦福MIT等機構首次提出「精度感知」scaling law,揭示了精度、參數規模、數據量之間的統一關系。數據量增加,...
Token化一切,甚至網絡!北大&谷歌&馬普所提出TokenFormer,Transformer從來沒有這么靈活過!
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
首個多模態連續學習綜述,港中文、清華、UIC聯合發布
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
finetune后的模型參數,還可以繼續怎么玩?
大會預告12月5日-6日,2024中國生成式AI大會(上海站)將舉辦。上海科大助理教授、博導顧家遠,騰訊優圖實驗室天衍研究中心負責人吳賢,銀河通用機器人合伙人...
有生命的AI?AI Agent的應用可不只游戲NPC|對話超參數科技
視點 發自 凹非寺量子位|公眾號 QbitAIAI與游戲一直以來都是相輔相成的關系。 過去,AI在游戲中不斷訓練升級,電子游戲、象棋、圍棋都曾是AI的訓練場。如今...
微軟開源爆火1.58bit大模型推理框架!千億參數模型量化后單CPU可跑,速度每秒5-7個token
西風 發自 凹非寺量子位 | 公眾號 QbitAI微軟開源1bit大模型推理框架! 現在1000億參數大模型量化后單CPU可跑,速度可達每秒5-7個token。 比如在蘋果M2新品上...
NeurIPS 2024 Oral | 小參數,大作為!揭秘非對稱 LoRA 架構的高效性能
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
Jurgen、曼寧等大佬新作:MoE重塑6年前的Universal Transformer,高效升級
機器之心報道 編輯:杜偉、蛋醬7 年前,谷歌在論文《Attention is All You Need》中提出了 Transformer。就在 Transformer 提出的第二年,谷歌又發布了 Unive...
沖出“包圍圈”,階躍星辰登頂國內多模態理解大模型榜首
說起階躍星辰,可以說是 AI 六小強中最低調的一個,但最近這家公司在 AI 圈里頻頻“鬧出動靜”。 前幾天,中文大模型基準測評機構 SuperCLUE 發布了 10 月中文...
學生最偉大的新研究!書里的斜坡實驗、透鏡變化規律用AI都動起來了
夕小瑤科技說 分享來源 | 機器之心原來物理還能這么學。 學習物理,不同的人自然有不同的經歷。一些人覺得物理課簡單直觀,但另一些人卻認為它抽象又反直覺,...
OpenAI今天Open了一下:開源多智能體框架Swarm
夕小瑤科技說 分享來源 | 機器之心毫無疑問,多智能體肯定是 OpenAI 未來重要的研究方向之一,前些天 OpenAI 著名研究科學家 Noam Brown還在 X 上為 OpenAI ...
NeurIPS 2024 | 大模型的詞表大小,同樣適用于Scaling Law
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
微調大模型,AMD MI300X就夠了!跟著這篇博客微調Llama 3.1 405B,效果媲美H100
機器之心報道 機器之心編輯部隨著 AI 模型的參數量越來越大,對算力的需求也水漲船高。 比如最近,Llama-3.1 登上了最強開源大模型的寶座,但超大杯 405B 版...
圖解大模型訓練之:數據并行上篇(DP, DDP與ZeRO)
GTIC 2024中國AI PC創新峰會將于10月11日,在2024上海國際消費電子展TechG同期舉辦。聯想集團首席研究員顏毅強、榮耀終端有限公司PC產品研發系統部部長席迎軍...