最受歡迎開源大模型，為什么是通義？

AIGC動(dòng)態(tài)1年前 (2024)發(fā)布 AI科技評(píng)論

最受歡迎開源大模型，為什么是通義？

AIGC動(dòng)態(tài)歡迎閱讀

原標(biāo)題：最受歡迎開源大模型，為什么是通義？
關(guān)鍵字：模型,開發(fā)者,阿里,尺寸,系列
文章來(lái)源：AI科技評(píng)論
內(nèi)容字?jǐn)?shù)：0字

內(nèi)容摘要：

開源一年，通義千問(wèn)的血緣模型已經(jīng)達(dá)到 5 萬(wàn)多個(gè)。作者丨張進(jìn)
編輯丨陳彩嫻
開源與閉源之爭(zhēng)早已非新奇的話題，但毋庸置疑的是，開源極大地促進(jìn)了大模型技術(shù)發(fā)展和生態(tài)繁榮。
大模型被認(rèn)為是最燒錢的技術(shù)，訓(xùn)練一個(gè)大模型往往需要大量的數(shù)據(jù)、計(jì)算資源，導(dǎo)致訓(xùn)練成本巨大，眾所周知GPT-3的訓(xùn)練費(fèi)用據(jù)說(shuō)超過(guò) 4600萬(wàn)美元，在大模型開源之前，大模型一直是那些有大量資金加持的大廠和明星創(chuàng)業(yè)公司才有資格碰的事情。
隨著如 llama、Mistral、Falcon 這些開源先鋒攪動(dòng)了整個(gè)大模型競(jìng)爭(zhēng)浪潮，那些沒有AI積累的企業(yè)、大量中小公司團(tuán)隊(duì)，今天個(gè)人開發(fā)者，都能基于開源底座模型，用很低的成本訓(xùn)練、部署自己的專屬模型，llama 這樣的開源先鋒也因此擁有一眾擁躉。
回到國(guó)內(nèi)，在 llama、Mistral 這樣的開源先鋒影響下，國(guó)產(chǎn)開源也經(jīng)歷了百家爭(zhēng)鳴階段，如ChatGLM、Baichuan、DeepSeek、Qwen也曾掀起一陣陣開源浪潮。
“百模大戰(zhàn)”至今不過(guò)一年多，全球開源格局已幾經(jīng)變換，最出人意料的一件事，莫過(guò)于國(guó)產(chǎn)開源大模型先發(fā)后至，有了比肩全球頂尖開源模型的影響力。通義千問(wèn)開源模型，就是“國(guó)模

原文鏈接：最受歡迎開源大模型，為什么是通義？