大模型瘋狂 Rush,上海 AI Lab 回歸語言建模本質(zhì)
AIGC動態(tài)歡迎閱讀
原標(biāo)題:大模型瘋狂 Rush,上海 AI Lab 回歸語言建模本質(zhì)
關(guān)鍵字:模型,能力,數(shù)據(jù),人工智能,實驗室
文章來源:AI科技評論
內(nèi)容字數(shù):12928字
內(nèi)容摘要:
做大模型,還是要回歸到難且價值大的事情上去。作者丨王 悅
編輯丨陳彩嫻
2023 年,是國內(nèi)外大模型瘋狂 rush 的一年。
在這場白熱化的競爭中,大模型過剩帶來的市場擠壓感正時刻提醒著參與者所面臨的行業(yè)洗牌風(fēng)險。各廠商深知,基礎(chǔ)通用大模型,注定是少數(shù)人的游戲。
為了贏得這場游戲,各家大模型多以一月四次的頻率飛速迭代自身產(chǎn)品。這么做的原因,無非是看中沖在前面的先發(fā)優(yōu)勢——這可以在一定的商業(yè)周期中,與后來者拉開不小的距離。
加之?dāng)?shù)據(jù)上的“飛輪效應(yīng)”,更早應(yīng)用、更多用戶的大模型,具備更高的市場打開度。
誠然,更靠前的身位的確重要,但過度地重視速度,則容易忽略大模型落地所需要的長周期、重基建和工程化難度——底層基礎(chǔ)尚不堅固就匆匆在此基礎(chǔ)上搭建高樓,其效果往往是「基礎(chǔ)不牢,地動山搖」。
雖說如此做法也可以營造繁榮的表象,成功地將模型的成績在某些特定的方面提上來,且在評測榜單中處于一個比較不錯的位置,但其背后,則更多地依靠專項調(diào)優(yōu)的方法,潛力十分有限。
經(jīng)過市場的狂熱期,整個行業(yè)意識到,還是要更多地關(guān)注基礎(chǔ)能力是否真正取得了進步。
不同于商業(yè)化的大模型廠商,上海人工智能實驗室在這場角逐中則穩(wěn)定地
原文鏈接:大模型瘋狂 Rush,上海 AI Lab 回歸語言建模本質(zhì)
聯(lián)系作者
文章來源:AI科技評論
作者微信:aitechtalk
作者簡介:雷峰網(wǎng)旗下AI新媒體。聚焦AI前沿研究,關(guān)注AI工程落地。