標(biāo)簽:作者

幻方AI ESFT:針對 MoE 的高效微調(diào)方案,媲美全參微調(diào)

生成式AI時(shí)代最火AI芯片峰會(huì)下月來襲!9月6-7日,智猩猩發(fā)起主辦的2024全球AI芯片峰會(huì)將在北京盛大舉行。峰會(huì)設(shè)有開幕式、數(shù)據(jù)中心AI芯片專場、邊緣/端側(cè)AI芯...
閱讀原文

LLaMA 3 背后的大規(guī)模 GPU 集群 RoCE 網(wǎng)絡(luò)建設(shè)

生成式AI時(shí)代最火AI芯片峰會(huì)下月來襲!9月6-7日,智猩猩發(fā)起主辦的2024全球AI芯片峰會(huì)將在北京盛大舉行。峰會(huì)設(shè)有開幕式、數(shù)據(jù)中心AI芯片專場、邊緣/端側(cè)AI芯...
閱讀原文

ACL 2024大獎(jiǎng)揭曉!全華人團(tuán)隊(duì)用AI3000年前甲骨文密碼

新智元報(bào)道編輯:編輯部 【新智元導(dǎo)讀】一年一度NLP頂會(huì)ACL揭曉了最終獲獎(jiǎng)?wù)撐摹=衲辏灿?篇論文榮獲最佳論文,時(shí)間檢驗(yàn)獎(jiǎng)?lì)C給斯坦福GloVe、康奈爾大學(xué)相似...
閱讀原文

ACL 2024獎(jiǎng)項(xiàng)公布:華科大破譯甲骨文最佳論文之一、GloVe時(shí)間檢驗(yàn)獎(jiǎng)

機(jī)器之心報(bào)道 機(jī)器之心編輯部本屆 ACL 大會(huì),投稿者「收獲滿滿」。為期六天的 ACL 2024 正在泰國曼谷舉辦。ACL 是計(jì)算語言學(xué)和自然語言處理領(lǐng)域的頂級國際會(huì)...
閱讀原文

萬字綜述:全面梳理 FP8 訓(xùn)練和推理技術(shù)

大模型時(shí)代最火AI芯片峰會(huì)來啦!!9月6-7日,由智猩猩聯(lián)合主辦的2024全球AI芯片峰會(huì)將在北京舉行。峰會(huì)設(shè)有數(shù)據(jù)中心AI芯片、智算集群技術(shù)論壇等7大板塊。目前...
閱讀原文

比Stable Diffusion便宜118倍!1890美元訓(xùn)出11.6億參數(shù)高質(zhì)量文生圖模型

新智元報(bào)道編輯:alan 【新智元導(dǎo)讀】近日,來自加州大學(xué)爾灣分校等機(jī)構(gòu)的研究人員,利用延遲掩蔽、MoE、分層擴(kuò)展等策略,將擴(kuò)散模型的訓(xùn)練成本降到了1890美...
閱讀原文

21.5萬張X光,78萬個(gè)問題!德州大學(xué)NIH等聯(lián)合發(fā)布醫(yī)學(xué)視覺問答數(shù)據(jù)集Medical-CXR-VQA

新智元報(bào)道編輯:LRST 好困 【新智元導(dǎo)讀】多模態(tài)大語言模型(MLLM)在醫(yī)學(xué)視覺問答(VQA)領(lǐng)域展現(xiàn)出巨大潛力,通過提供針對醫(yī)學(xué)圖像的具體臨床問題的回答,...
閱讀原文

ICML 2024演講爆火!Meta朱澤園揭秘大模型內(nèi)心世界:不同于人類的2級推理

AIxiv專欄是機(jī)器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過去數(shù)年,機(jī)器之心AIxiv專欄接收報(bào)道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級實(shí)驗(yàn)室,有效促進(jìn)了學(xué)術(shù)...
閱讀原文

1890美元,就能從頭訓(xùn)練一個(gè)還不錯(cuò)的12億參數(shù)擴(kuò)散模型

機(jī)器之心報(bào)道 編輯:張倩、陳陳只用1890美元、3700 萬張圖像,就能訓(xùn)練一個(gè)還不錯(cuò)的擴(kuò)散模型。現(xiàn)階段,視覺生成模型擅長創(chuàng)建逼真的視覺內(nèi)容,然而從頭開始訓(xùn)...
閱讀原文

ICML 2024十篇最佳論文開獎(jiǎng)!賈揚(yáng)清十年經(jīng)典之作獲時(shí)間檢驗(yàn)獎(jiǎng)

夕小瑤科技說 分享來源 | 新智元ICML 2024大獎(jiǎng)新鮮出爐了!剛剛,ICML開幕式正式召開,會(huì)上公布了10篇最佳論文獎(jiǎng),還有1篇十年前論文摘得時(shí)間檢驗(yàn)獎(jiǎng)。最佳論...
閱讀原文

賈揚(yáng)清共一論文獲ICML時(shí)間檢驗(yàn)獎(jiǎng):首個(gè)開源版AlexNet,著名框架Caffe前身,最佳論文獎(jiǎng)也已公布

西風(fēng) 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAIICML 2024時(shí)間檢驗(yàn)獎(jiǎng)出爐,賈揚(yáng)清共同一作論文獲獎(jiǎng)! 論文題為“DeCAF: A Deep Convolutional Activation Feature for...
閱讀原文

賈揚(yáng)清十年經(jīng)典之作獲時(shí)間檢驗(yàn)獎(jiǎng)!ICML 2024十篇最佳論文開獎(jiǎng),爆火SD3、谷歌Genie在列

新智元報(bào)道編輯:桃子 好困 【新智元導(dǎo)讀】一年一度的ICML頂會(huì)大獎(jiǎng)終于公布了!今年,共有十篇論文奪得最佳論文獎(jiǎng),而這其中的3篇可謂是家喻戶曉——圖像生成模...
閱讀原文

電腦平板組AI集群,在家就能跑400B大模型,GitHub狂攬2.5K星?

克雷西 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI不用H100,三臺(tái)蘋果電腦就能帶動(dòng)400B大模型。 背后的功臣,是GitHub上的一個(gè)開源分布式AI推理框架,已經(jīng)斬獲了2.5k...
閱讀原文

爆火免費(fèi)書《深入理解深度學(xué)習(xí)》終于出中文版了

機(jī)器之心報(bào)道 編輯:澤南、小舟這可能是當(dāng)今最全面、最新的深度學(xué)習(xí)概述之一。 爆火的深度學(xué)習(xí)領(lǐng)域,最近又有了熱門學(xué)習(xí)資料。 近日,麻省理工出版社的新書《...
閱讀原文

配方脫口而出,過去時(shí)態(tài)讓GPT-4o防線崩塌!成功率從1%暴漲至88%

新智元報(bào)道編輯:桃子 【新智元導(dǎo)讀】最高端的大模型,往往需要最樸實(shí)的語言破解。來自EPFL機(jī)構(gòu)研究人員發(fā)現(xiàn),僅將一句有害請求,改寫成過去時(shí)態(tài),包括GPT-4o...
閱讀原文
1234513