標簽:作者
幻方AI ESFT:針對 MoE 的高效微調方案,媲美全參微調
生成式AI時代最火AI芯片峰會下月來襲!9月6-7日,智猩猩發起主辦的2024全球AI芯片峰會將在北京盛大舉行。峰會設有開幕式、數據中心AI芯片專場、邊緣/端側AI芯...
LLaMA 3 背后的大規模 GPU 集群 RoCE 網絡建設
生成式AI時代最火AI芯片峰會下月來襲!9月6-7日,智猩猩發起主辦的2024全球AI芯片峰會將在北京盛大舉行。峰會設有開幕式、數據中心AI芯片專場、邊緣/端側AI芯...
ACL 2024大獎揭曉!全華人團隊用AI3000年前甲骨文密碼
新智元報道編輯:編輯部 【新智元導讀】一年一度NLP頂會ACL揭曉了最終獲獎論文。今年,共有7篇論文榮獲最佳論文,時間檢驗獎頒給斯坦福GloVe、康奈爾大學相似...
ACL 2024獎項公布:華科大破譯甲骨文最佳論文之一、GloVe時間檢驗獎
機器之心報道 機器之心編輯部本屆 ACL 大會,投稿者「收獲滿滿」。為期六天的 ACL 2024 正在泰國曼谷舉辦。ACL 是計算語言學和自然語言處理領域的頂級國際會...
萬字綜述:全面梳理 FP8 訓練和推理技術
大模型時代最火AI芯片峰會來啦!!9月6-7日,由智猩猩聯合主辦的2024全球AI芯片峰會將在北京舉行。峰會設有數據中心AI芯片、智算集群技術論壇等7大板塊。目前...
比Stable Diffusion便宜118倍!1890美元訓出11.6億參數高質量文生圖模型
新智元報道編輯:alan 【新智元導讀】近日,來自加州大學爾灣分校等機構的研究人員,利用延遲掩蔽、MoE、分層擴展等策略,將擴散模型的訓練成本降到了1890美...
21.5萬張X光,78萬個問題!德州大學NIH等聯合發布醫學視覺問答數據集Medical-CXR-VQA
新智元報道編輯:LRST 好困 【新智元導讀】多模態大語言模型(MLLM)在醫學視覺問答(VQA)領域展現出巨大潛力,通過提供針對醫學圖像的具體臨床問題的回答,...
ICML 2024演講爆火!Meta朱澤園揭秘大模型內心世界:不同于人類的2級推理
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
1890美元,就能從頭訓練一個還不錯的12億參數擴散模型
機器之心報道 編輯:張倩、陳陳只用1890美元、3700 萬張圖像,就能訓練一個還不錯的擴散模型。現階段,視覺生成模型擅長創建逼真的視覺內容,然而從頭開始訓...
ICML 2024十篇最佳論文開獎!賈揚清十年經典之作獲時間檢驗獎
夕小瑤科技說 分享來源 | 新智元ICML 2024大獎新鮮出爐了!剛剛,ICML開幕式正式召開,會上公布了10篇最佳論文獎,還有1篇十年前論文摘得時間檢驗獎。最佳論...
賈揚清共一論文獲ICML時間檢驗獎:首個開源版AlexNet,著名框架Caffe前身,最佳論文獎也已公布
西風 發自 凹非寺量子位 | 公眾號 QbitAIICML 2024時間檢驗獎出爐,賈揚清共同一作論文獲獎! 論文題為“DeCAF: A Deep Convolutional Activation Feature for...
賈揚清十年經典之作獲時間檢驗獎!ICML 2024十篇最佳論文開獎,爆火SD3、谷歌Genie在列
新智元報道編輯:桃子 好困 【新智元導讀】一年一度的ICML頂會大獎終于公布了!今年,共有十篇論文奪得最佳論文獎,而這其中的3篇可謂是家喻戶曉——圖像生成模...
電腦平板組AI集群,在家就能跑400B大模型,GitHub狂攬2.5K星?
克雷西 發自 凹非寺量子位 | 公眾號 QbitAI不用H100,三臺蘋果電腦就能帶動400B大模型。 背后的功臣,是GitHub上的一個開源分布式AI推理框架,已經斬獲了2.5k...
爆火免費書《深入理解深度學習》終于出中文版了
機器之心報道 編輯:澤南、小舟這可能是當今最全面、最新的深度學習概述之一。 爆火的深度學習領域,最近又有了熱門學習資料。 近日,麻省理工出版社的新書《...
配方脫口而出,過去時態讓GPT-4o防線崩塌!成功率從1%暴漲至88%
新智元報道編輯:桃子 【新智元導讀】最高端的大模型,往往需要最樸實的語言破解。來自EPFL機構研究人員發現,僅將一句有害請求,改寫成過去時態,包括GPT-4o...