最受歡迎開源大模型,為什么是通義?

AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:最受歡迎開源大模型,為什么是通義?
關(guān)鍵字:模型,開發(fā)者,阿里,尺寸,系列
文章來(lái)源:AI科技評(píng)論
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
開源一年,通義千問(wèn)的血緣模型已經(jīng)達(dá)到 5 萬(wàn)多個(gè)。作者丨張進(jìn)
編輯丨陳彩嫻
開源與閉源之爭(zhēng)早已非新奇的話題,但毋庸置疑的是,開源極大地促進(jìn)了大模型技術(shù)發(fā)展和生態(tài)繁榮。
大模型被認(rèn)為是最燒錢的技術(shù),訓(xùn)練一個(gè)大模型往往需要大量的數(shù)據(jù)、計(jì)算資源,導(dǎo)致訓(xùn)練成本巨大,眾所周知GPT-3的訓(xùn)練費(fèi)用據(jù)說(shuō)超過(guò) 4600萬(wàn)美元,在大模型開源之前,大模型一直是那些有大量資金加持的大廠和明星創(chuàng)業(yè)公司才有資格碰的事情。
隨著如 llama、Mistral、Falcon 這些開源先鋒攪動(dòng)了整個(gè)大模型競(jìng)爭(zhēng)浪潮,那些沒有AI積累的企業(yè)、大量中小公司團(tuán)隊(duì),今天個(gè)人開發(fā)者,都能基于開源底座模型,用很低的成本訓(xùn)練、部署自己的專屬模型,llama 這樣的開源先鋒也因此擁有一眾擁躉。
回到國(guó)內(nèi),在 llama、Mistral 這樣的開源先鋒影響下,國(guó)產(chǎn)開源也經(jīng)歷了百家爭(zhēng)鳴階段,如ChatGLM、Baichuan、DeepSeek、Qwen也曾掀起一陣陣開源浪潮。
“百模大戰(zhàn)”至今不過(guò)一年多,全球開源格局已幾經(jīng)變換,最出人意料的一件事,莫過(guò)于國(guó)產(chǎn)開源大模型先發(fā)后至,有了比肩全球頂尖開源模型的影響力。通義千問(wèn)開源模型,就是“國(guó)模
原文鏈接:最受歡迎開源大模型,為什么是通義?
聯(lián)系作者
文章來(lái)源:AI科技評(píng)論
作者微信:
作者簡(jiǎn)介:

粵公網(wǎng)安備 44011502001135號(hào)