標(biāo)簽:大小
WPS接入DeepSeek,秒變辦公神器!
WPS 大家經(jīng)常用來日常寫作,雖然本身提供了AI功能,但可惜需要會員,本文教你三分鐘接入最火的DeepSeek,讓W(xué)PS秒變辦公神器。 DeepSeek API申請地址:http:/...
AI賺錢副業(yè)~AI生成影視解說,半個月漲粉變現(xiàn)3.5W+!
這兩年大家都在感嘆生活不易,然而我想說的是,機會還是有的,但問題不在于有沒有,而在于你是否能夠認準機會,然后抓住它。 接觸過很多咨詢項目的人,發(fā)現(xiàn)...
vLLM vs TensorRT-LLM 性能對比測試,基于0910較新版本
大會預(yù)告12月5日-6日,2024中國生成式AI大會(上海站)將舉辦。上海科大助理教授、博導(dǎo)顧家遠,騰訊優(yōu)圖實驗室天衍研究中心負責(zé)人吳賢,銀河通用機器人合伙人...
深入淺出Batch Size,對模型訓(xùn)練的影響分析
開講預(yù)告11月7日晚7點,上海 AI Lab OpenGVLab 博士后研究員羅根,將以《Mono-InternVL: 突破原生多模態(tài)大模型性能瓶頸》為主題進行直播講解,歡迎掃碼報名~...
NeurIPS 2024 | 大模型的詞表大小,同樣適用于Scaling Law
AIxiv專欄是機器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過去數(shù)年,機器之心AIxiv專欄接收報道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級實驗室,有效促進了學(xué)術(shù)...
數(shù)據(jù)集匯總|18個電影/音樂數(shù)據(jù)集匯總,覆蓋影片/歌曲推薦、電影評價、歌詞識別、音樂流派······
作者:李姝 編輯:李寶珠 HyperAI超神經(jīng) (hyper.ai) 為大家匯總了電影與音樂相關(guān)的數(shù)據(jù)集,覆蓋電影/音樂推薦、電影預(yù)測、歌詞識別等各個方面,純干貨技術(shù)分...
圖解大模型訓(xùn)練之:流水線并行,以GPipe為例
回顧ChatGPT的發(fā)展歷程,我們可以總結(jié)出大語言模型(LLM)取得驚艷效果的要點(重要性從高到低排序): 愿意燒錢,且接受“燒錢 != 好模型”的現(xiàn)實 高質(zhì)量的訓(xùn)...
圖解大模型訓(xùn)練之:流水線并行,以GPipe為例
回顧ChatGPT的發(fā)展歷程,我們可以總結(jié)出大語言模型(LLM)取得驚艷效果的要點(重要性從高到低排序): 愿意燒錢,且接受“燒錢 != 好模型”的現(xiàn)實 高質(zhì)量的訓(xùn)...
圖解大模型訓(xùn)練之:流水線并行,以GPipe為例
回顧ChatGPT的發(fā)展歷程,我們可以總結(jié)出大語言模型(LLM)取得驚艷效果的要點(重要性從高到低排序): 愿意燒錢,且接受“燒錢 != 好模型”的現(xiàn)實 高質(zhì)量的訓(xùn)...
Mistral多模態(tài)大模型來了!120億參數(shù),原生支持任意大小/數(shù)量圖像,公司估值已達420億
明敏 發(fā)自 凹非寺量子位 | 公眾號 QbitAIMistral的多模態(tài)大模型來了! Pixtral 12B正式發(fā)布,同時具備語言和視覺處理能力。 它建立在文本模型Nemo 12B基礎(chǔ)上...
數(shù)據(jù)集匯總丨蘿卜快跑明年盈利?自動駕駛開啟「端到端」新時代,高質(zhì)量數(shù)據(jù)集助力 AI 大模型上車
作者:李姝 編輯:李姝 自動駕駛開啟「端到端」新時代,高質(zhì)量數(shù)據(jù)集扮演重要角色。對此,HyperAI超神經(jīng)為大家匯總了熱門開源的自動駕駛數(shù)據(jù)集,快來收藏使用...
MoE也有Scaling Law,「百萬專家」利用率近100%!DeepMind華人挑戰(zhàn)MoE極限
新智元報道編輯:編輯部 【新智元導(dǎo)讀】MoE已然成為AI界的主流架構(gòu),不論是開源Grok,還是閉源GPT-4,皆是其擁躉。然而,這些模型的專家,最大數(shù)量僅有32個。...
開發(fā)者狂喜!Meta最新發(fā)布的LLM Compiler,實現(xiàn)77%自動調(diào)優(yōu)效率
機器之心報道 編輯:山茶花Meta搞了個很牛的LLM Compiler,幫助程序員更高效地寫代碼。昨天,三大 AI 巨頭 OpenAI、Google、Meta 組團發(fā)布自家大模型最新研究...
Intel入局大模型,燒錢搜索130億種網(wǎng)絡(luò)結(jié)構(gòu),讓LLaMa2瘦身30%
夕小瑤科技說 原創(chuàng)作者 | 任同學(xué)大語言模型在多個領(lǐng)域大放異彩,但它們的高內(nèi)存和計算成本限制了廣泛使用。神經(jīng)架構(gòu)搜索(NAS)能自動找到最優(yōu)模型架構(gòu),減少...
用神經(jīng)架構(gòu)搜索給LLM瘦身,模型變小,準確度有時反而更高
機器之心報道 編輯:Panda用神經(jīng)架構(gòu)搜索給 LLM 瘦身,同等準確度可讓 LLaMA2-7B 模型大小降 2 倍。大型語言模型(LLM)的一個主要特點是「大」,也因此其訓(xùn)...
【圖像分割數(shù)據(jù)集匯總】字節(jié)發(fā)布 COCONut 入選 CVPR 2024,立即體驗 Segment Anything 分割萬物!
隨著計算機視覺技術(shù)的不斷發(fā)展,圖像分割在諸多領(lǐng)域展現(xiàn)出重要的應(yīng)用價值。近年來,各種圖像分割數(shù)據(jù)集如雨后春筍般涌現(xiàn)。上個月,字節(jié)跳動發(fā)布了首個大規(guī)模...
大模型一定就比小模型好?谷歌的這項研究說不一定
機器之心報道 編輯:Panda在這個大模型不斷創(chuàng)造新成就的時代,我們通常對機器學(xué)習(xí)模型有一個直觀認知:越大越好。但事實果真如此嗎? 近日,Google Research ...
12
粵公網(wǎng)安備 44011502001135號