標(biāo)簽:作者
幻方AI ESFT:針對 MoE 的高效微調(diào)方案,媲美全參微調(diào)
生成式AI時(shí)代最火AI芯片峰會(huì)下月來襲!9月6-7日,智猩猩發(fā)起主辦的2024全球AI芯片峰會(huì)將在北京盛大舉行。峰會(huì)設(shè)有開幕式、數(shù)據(jù)中心AI芯片專場、邊緣/端側(cè)AI芯...
LLaMA 3 背后的大規(guī)模 GPU 集群 RoCE 網(wǎng)絡(luò)建設(shè)
生成式AI時(shí)代最火AI芯片峰會(huì)下月來襲!9月6-7日,智猩猩發(fā)起主辦的2024全球AI芯片峰會(huì)將在北京盛大舉行。峰會(huì)設(shè)有開幕式、數(shù)據(jù)中心AI芯片專場、邊緣/端側(cè)AI芯...
ACL 2024大獎(jiǎng)揭曉!全華人團(tuán)隊(duì)用AI3000年前甲骨文密碼
新智元報(bào)道編輯:編輯部 【新智元導(dǎo)讀】一年一度NLP頂會(huì)ACL揭曉了最終獲獎(jiǎng)?wù)撐摹=衲辏灿?篇論文榮獲最佳論文,時(shí)間檢驗(yàn)獎(jiǎng)?lì)C給斯坦福GloVe、康奈爾大學(xué)相似...
ACL 2024獎(jiǎng)項(xiàng)公布:華科大破譯甲骨文最佳論文之一、GloVe時(shí)間檢驗(yàn)獎(jiǎng)
機(jī)器之心報(bào)道 機(jī)器之心編輯部本屆 ACL 大會(huì),投稿者「收獲滿滿」。為期六天的 ACL 2024 正在泰國曼谷舉辦。ACL 是計(jì)算語言學(xué)和自然語言處理領(lǐng)域的頂級國際會(huì)...
萬字綜述:全面梳理 FP8 訓(xùn)練和推理技術(shù)
大模型時(shí)代最火AI芯片峰會(huì)來啦!!9月6-7日,由智猩猩聯(lián)合主辦的2024全球AI芯片峰會(huì)將在北京舉行。峰會(huì)設(shè)有數(shù)據(jù)中心AI芯片、智算集群技術(shù)論壇等7大板塊。目前...
比Stable Diffusion便宜118倍!1890美元訓(xùn)出11.6億參數(shù)高質(zhì)量文生圖模型
新智元報(bào)道編輯:alan 【新智元導(dǎo)讀】近日,來自加州大學(xué)爾灣分校等機(jī)構(gòu)的研究人員,利用延遲掩蔽、MoE、分層擴(kuò)展等策略,將擴(kuò)散模型的訓(xùn)練成本降到了1890美...
21.5萬張X光,78萬個(gè)問題!德州大學(xué)NIH等聯(lián)合發(fā)布醫(yī)學(xué)視覺問答數(shù)據(jù)集Medical-CXR-VQA
新智元報(bào)道編輯:LRST 好困 【新智元導(dǎo)讀】多模態(tài)大語言模型(MLLM)在醫(yī)學(xué)視覺問答(VQA)領(lǐng)域展現(xiàn)出巨大潛力,通過提供針對醫(yī)學(xué)圖像的具體臨床問題的回答,...
ICML 2024演講爆火!Meta朱澤園揭秘大模型內(nèi)心世界:不同于人類的2級推理
AIxiv專欄是機(jī)器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過去數(shù)年,機(jī)器之心AIxiv專欄接收報(bào)道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級實(shí)驗(yàn)室,有效促進(jìn)了學(xué)術(shù)...
1890美元,就能從頭訓(xùn)練一個(gè)還不錯(cuò)的12億參數(shù)擴(kuò)散模型
機(jī)器之心報(bào)道 編輯:張倩、陳陳只用1890美元、3700 萬張圖像,就能訓(xùn)練一個(gè)還不錯(cuò)的擴(kuò)散模型。現(xiàn)階段,視覺生成模型擅長創(chuàng)建逼真的視覺內(nèi)容,然而從頭開始訓(xùn)...
ICML 2024十篇最佳論文開獎(jiǎng)!賈揚(yáng)清十年經(jīng)典之作獲時(shí)間檢驗(yàn)獎(jiǎng)
夕小瑤科技說 分享來源 | 新智元ICML 2024大獎(jiǎng)新鮮出爐了!剛剛,ICML開幕式正式召開,會(huì)上公布了10篇最佳論文獎(jiǎng),還有1篇十年前論文摘得時(shí)間檢驗(yàn)獎(jiǎng)。最佳論...
賈揚(yáng)清共一論文獲ICML時(shí)間檢驗(yàn)獎(jiǎng):首個(gè)開源版AlexNet,著名框架Caffe前身,最佳論文獎(jiǎng)也已公布
西風(fēng) 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAIICML 2024時(shí)間檢驗(yàn)獎(jiǎng)出爐,賈揚(yáng)清共同一作論文獲獎(jiǎng)! 論文題為“DeCAF: A Deep Convolutional Activation Feature for...
賈揚(yáng)清十年經(jīng)典之作獲時(shí)間檢驗(yàn)獎(jiǎng)!ICML 2024十篇最佳論文開獎(jiǎng),爆火SD3、谷歌Genie在列
新智元報(bào)道編輯:桃子 好困 【新智元導(dǎo)讀】一年一度的ICML頂會(huì)大獎(jiǎng)終于公布了!今年,共有十篇論文奪得最佳論文獎(jiǎng),而這其中的3篇可謂是家喻戶曉——圖像生成模...
電腦平板組AI集群,在家就能跑400B大模型,GitHub狂攬2.5K星?
克雷西 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI不用H100,三臺(tái)蘋果電腦就能帶動(dòng)400B大模型。 背后的功臣,是GitHub上的一個(gè)開源分布式AI推理框架,已經(jīng)斬獲了2.5k...
爆火免費(fèi)書《深入理解深度學(xué)習(xí)》終于出中文版了
機(jī)器之心報(bào)道 編輯:澤南、小舟這可能是當(dāng)今最全面、最新的深度學(xué)習(xí)概述之一。 爆火的深度學(xué)習(xí)領(lǐng)域,最近又有了熱門學(xué)習(xí)資料。 近日,麻省理工出版社的新書《...
配方脫口而出,過去時(shí)態(tài)讓GPT-4o防線崩塌!成功率從1%暴漲至88%
新智元報(bào)道編輯:桃子 【新智元導(dǎo)讀】最高端的大模型,往往需要最樸實(shí)的語言破解。來自EPFL機(jī)構(gòu)研究人員發(fā)現(xiàn),僅將一句有害請求,改寫成過去時(shí)態(tài),包括GPT-4o...