標(biāo)簽:作者
幻方AI ESFT:針對 MoE 的高效微調(diào)方案,媲美全參微調(diào)
生成式AI時代最火AI芯片峰會下月來襲!9月6-7日,智猩猩發(fā)起主辦的2024全球AI芯片峰會將在北京盛大舉行。峰會設(shè)有開幕式、數(shù)據(jù)中心AI芯片專場、邊緣/端側(cè)AI芯...
LLaMA 3 背后的大規(guī)模 GPU 集群 RoCE 網(wǎng)絡(luò)建設(shè)
生成式AI時代最火AI芯片峰會下月來襲!9月6-7日,智猩猩發(fā)起主辦的2024全球AI芯片峰會將在北京盛大舉行。峰會設(shè)有開幕式、數(shù)據(jù)中心AI芯片專場、邊緣/端側(cè)AI芯...
ACL 2024大獎揭曉!全華人團隊用AI3000年前甲骨文密碼
新智元報道編輯:編輯部 【新智元導(dǎo)讀】一年一度NLP頂會ACL揭曉了最終獲獎?wù)撐摹=衲辏灿?篇論文榮獲最佳論文,時間檢驗獎頒給斯坦福GloVe、康奈爾大學(xué)相似...
ACL 2024獎項公布:華科大破譯甲骨文最佳論文之一、GloVe時間檢驗獎
機器之心報道 機器之心編輯部本屆 ACL 大會,投稿者「收獲滿滿」。為期六天的 ACL 2024 正在泰國曼谷舉辦。ACL 是計算語言學(xué)和自然語言處理領(lǐng)域的頂級國際會...
萬字綜述:全面梳理 FP8 訓(xùn)練和推理技術(shù)
大模型時代最火AI芯片峰會來啦!!9月6-7日,由智猩猩聯(lián)合主辦的2024全球AI芯片峰會將在北京舉行。峰會設(shè)有數(shù)據(jù)中心AI芯片、智算集群技術(shù)論壇等7大板塊。目前...
比Stable Diffusion便宜118倍!1890美元訓(xùn)出11.6億參數(shù)高質(zhì)量文生圖模型
新智元報道編輯:alan 【新智元導(dǎo)讀】近日,來自加州大學(xué)爾灣分校等機構(gòu)的研究人員,利用延遲掩蔽、MoE、分層擴展等策略,將擴散模型的訓(xùn)練成本降到了1890美...
21.5萬張X光,78萬個問題!德州大學(xué)NIH等聯(lián)合發(fā)布醫(yī)學(xué)視覺問答數(shù)據(jù)集Medical-CXR-VQA
新智元報道編輯:LRST 好困 【新智元導(dǎo)讀】多模態(tài)大語言模型(MLLM)在醫(yī)學(xué)視覺問答(VQA)領(lǐng)域展現(xiàn)出巨大潛力,通過提供針對醫(yī)學(xué)圖像的具體臨床問題的回答,...
ICML 2024演講爆火!Meta朱澤園揭秘大模型內(nèi)心世界:不同于人類的2級推理
AIxiv專欄是機器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過去數(shù)年,機器之心AIxiv專欄接收報道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級實驗室,有效促進了學(xué)術(shù)...
1890美元,就能從頭訓(xùn)練一個還不錯的12億參數(shù)擴散模型
機器之心報道 編輯:張倩、陳陳只用1890美元、3700 萬張圖像,就能訓(xùn)練一個還不錯的擴散模型。現(xiàn)階段,視覺生成模型擅長創(chuàng)建逼真的視覺內(nèi)容,然而從頭開始訓(xùn)...
ICML 2024十篇最佳論文開獎!賈揚清十年經(jīng)典之作獲時間檢驗獎
夕小瑤科技說 分享來源 | 新智元ICML 2024大獎新鮮出爐了!剛剛,ICML開幕式正式召開,會上公布了10篇最佳論文獎,還有1篇十年前論文摘得時間檢驗獎。最佳論...
賈揚清共一論文獲ICML時間檢驗獎:首個開源版AlexNet,著名框架Caffe前身,最佳論文獎也已公布
西風(fēng) 發(fā)自 凹非寺量子位 | 公眾號 QbitAIICML 2024時間檢驗獎出爐,賈揚清共同一作論文獲獎! 論文題為“DeCAF: A Deep Convolutional Activation Feature for...
賈揚清十年經(jīng)典之作獲時間檢驗獎!ICML 2024十篇最佳論文開獎,爆火SD3、谷歌Genie在列
新智元報道編輯:桃子 好困 【新智元導(dǎo)讀】一年一度的ICML頂會大獎終于公布了!今年,共有十篇論文奪得最佳論文獎,而這其中的3篇可謂是家喻戶曉——圖像生成模...
電腦平板組AI集群,在家就能跑400B大模型,GitHub狂攬2.5K星?
克雷西 發(fā)自 凹非寺量子位 | 公眾號 QbitAI不用H100,三臺蘋果電腦就能帶動400B大模型。 背后的功臣,是GitHub上的一個開源分布式AI推理框架,已經(jīng)斬獲了2.5k...
爆火免費書《深入理解深度學(xué)習(xí)》終于出中文版了
機器之心報道 編輯:澤南、小舟這可能是當(dāng)今最全面、最新的深度學(xué)習(xí)概述之一。 爆火的深度學(xué)習(xí)領(lǐng)域,最近又有了熱門學(xué)習(xí)資料。 近日,麻省理工出版社的新書《...
配方脫口而出,過去時態(tài)讓GPT-4o防線崩塌!成功率從1%暴漲至88%
新智元報道編輯:桃子 【新智元導(dǎo)讀】最高端的大模型,往往需要最樸實的語言破解。來自EPFL機構(gòu)研究人員發(fā)現(xiàn),僅將一句有害請求,改寫成過去時態(tài),包括GPT-4o...
粵公網(wǎng)安備 44011502001135號