大模型 VS 小模型
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:大模型 VS 小模型
關(guān)鍵字:模型,報(bào)告,知乎,數(shù)據(jù),概率
文章來(lái)源:智猩猩AGI
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
生成式AI時(shí)代最火AI芯片峰會(huì)下月來(lái)襲!9月6-7日,智猩猩發(fā)起主辦的2024全球AI芯片峰會(huì)將在北京盛大舉行。峰會(huì)設(shè)有開(kāi)幕式、數(shù)據(jù)中心AI芯片專場(chǎng)、邊緣/端側(cè)AI芯片專場(chǎng)、智算集群技術(shù)論壇等7大板塊。目前,來(lái)自AMD、高通、Habana、壁仞科技、摩爾線程、蘋(píng)芯科技、億鑄科技、凌川科技、云天勵(lì)飛、中國(guó)移動(dòng)研究院、北極雄芯等40+企業(yè)的嘉賓已確認(rèn)演講或討論。掃碼申請(qǐng)免費(fèi)票或購(gòu)票參會(huì)~今天給大家?guī)?lái)知乎好友@ybq一篇關(guān)于大模型和小模型討論的文章。首先,我們思考一個(gè)問(wèn)題,為什么 qwen2 基本上是當(dāng)下最受歡迎的開(kāi)源模型?說(shuō)實(shí)話,相比于 deepseek、llama、minicpm 這些誠(chéng)意滿滿的技術(shù)報(bào)告,qwen2 的技術(shù)報(bào)告稍顯一些“小家子氣”,并沒(méi)有提及到關(guān)鍵的技術(shù)細(xì)節(jié)。然而,qwen2 提供給開(kāi)源社區(qū)的“全家桶”套餐,又是多長(zhǎng)的技術(shù)報(bào)告也比不上的。對(duì) llm 的研究者來(lái)說(shuō),用相同 tokenizer,相同的 7T pretrain_data 得到的“一簇小 llm”,其研究?jī)r(jià)值遠(yuǎn)遠(yuǎn)超過(guò) Qwen2-72B 本身!
知乎:https://zhuanlan.zhihu.com/p/7
原文鏈接:大模型 VS 小模型
聯(lián)系作者
文章來(lái)源:智猩猩AGI
作者微信:
作者簡(jiǎn)介: