最受歡迎開源大模型,為什么是通義?
AIGC動態(tài)歡迎閱讀
原標題:最受歡迎開源大模型,為什么是通義?
關(guān)鍵字:模型,開發(fā)者,阿里,尺寸,系列
文章來源:AI科技評論
內(nèi)容字數(shù):0字
內(nèi)容摘要:
開源一年,通義千問的血緣模型已經(jīng)達到 5 萬多個。作者丨張進
編輯丨陳彩嫻
開源與閉源之爭早已非新奇的話題,但毋庸置疑的是,開源極大地促進了大模型技術(shù)發(fā)展和生態(tài)繁榮。
大模型被認為是最燒錢的技術(shù),訓練一個大模型往往需要大量的數(shù)據(jù)、計算資源,導致訓練成本巨大,眾所周知GPT-3的訓練費用據(jù)說超過 4600萬美元,在大模型開源之前,大模型一直是那些有大量資金加持的大廠和明星創(chuàng)業(yè)公司才有資格碰的事情。
隨著如 llama、Mistral、Falcon 這些開源先鋒攪動了整個大模型競爭浪潮,那些沒有AI積累的企業(yè)、大量中小公司團隊,今天個人開發(fā)者,都能基于開源底座模型,用很低的成本訓練、部署自己的專屬模型,llama 這樣的開源先鋒也因此擁有一眾擁躉。
回到國內(nèi),在 llama、Mistral 這樣的開源先鋒影響下,國產(chǎn)開源也經(jīng)歷了百家爭鳴階段,如ChatGLM、Baichuan、DeepSeek、Qwen也曾掀起一陣陣開源浪潮。
“百模大戰(zhàn)”至今不過一年多,全球開源格局已幾經(jīng)變換,最出人意料的一件事,莫過于國產(chǎn)開源大模型先發(fā)后至,有了比肩全球頂尖開源模型的影響力。通義千問開源模型,就是“國模
原文鏈接:最受歡迎開源大模型,為什么是通義?
聯(lián)系作者
文章來源:AI科技評論
作者微信:
作者簡介:
? 版權(quán)聲明
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載。
相關(guān)文章
暫無評論...