大模型瘋狂 Rush，上海 AI Lab 回歸語言建模本質(zhì)

AIGC動態(tài)1年前 (2024)發(fā)布 AI科技評論

AIGC動態(tài)歡迎閱讀

原標(biāo)題：大模型瘋狂 Rush，上海 AI Lab 回歸語言建模本質(zhì)
關(guān)鍵字：模型,能力,數(shù)據(jù),人工智能,實驗室
文章來源：AI科技評論
內(nèi)容字數(shù)：12928字

內(nèi)容摘要：

做大模型，還是要回歸到難且價值大的事情上去。作者丨王悅
編輯丨陳彩嫻
2023 年，是國內(nèi)外大模型瘋狂 rush 的一年。
在這場白熱化的競爭中，大模型過剩帶來的市場擠壓感正時刻提醒著參與者所面臨的行業(yè)洗牌風(fēng)險。各廠商深知，基礎(chǔ)通用大模型，注定是少數(shù)人的游戲。
為了贏得這場游戲，各家大模型多以一月四次的頻率飛速迭代自身產(chǎn)品。這么做的原因，無非是看中沖在前面的先發(fā)優(yōu)勢——這可以在一定的商業(yè)周期中，與后來者拉開不小的距離。
加之?dāng)?shù)據(jù)上的“飛輪效應(yīng)”，更早應(yīng)用、更多用戶的大模型，具備更高的市場打開度。
誠然，更靠前的身位的確重要，但過度地重視速度，則容易忽略大模型落地所需要的長周期、重基建和工程化難度——底層基礎(chǔ)尚不堅固就匆匆在此基礎(chǔ)上搭建高樓，其效果往往是「基礎(chǔ)不牢，地動山搖」。
雖說如此做法也可以營造繁榮的表象，成功地將模型的成績在某些特定的方面提上來，且在評測榜單中處于一個比較不錯的位置，但其背后，則更多地依靠專項調(diào)優(yōu)的方法，潛力十分有限。
經(jīng)過市場的狂熱期，整個行業(yè)意識到，還是要更多地關(guān)注基礎(chǔ)能力是否真正取得了進步。
不同于商業(yè)化的大模型廠商，上海人工智能實驗室在這場角逐中則穩(wěn)定地

原文鏈接：大模型瘋狂 Rush，上海 AI Lab 回歸語言建模本質(zhì)