兆級長文本,已是一線大模型機(jī)構(gòu)標(biāo)配能力丨上海AI Lab林達(dá)華
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:兆級長文本,已是一線大模型機(jī)構(gòu)標(biāo)配能力丨上海AI Lab林達(dá)華
關(guān)鍵字:模型,林達(dá),騰訊,能力,數(shù)據(jù)
文章來源:量子位
內(nèi)容字?jǐn)?shù):5990字
內(nèi)容摘要:
衡宇 發(fā)自 阿拉上海量子位 | 公眾號 QbitAI“據(jù)我了解,國內(nèi)多個(gè)一線大模型機(jī)構(gòu),都已經(jīng)突破了兆級的長文本能力。”
以上,是“2024全球開發(fā)者先鋒大會(huì)”大模型前沿論壇會(huì)間隙,上海人工智能實(shí)驗(yàn)室領(lǐng)軍科學(xué)家林達(dá)華與量子位的交談剪影。
林達(dá)華,深度學(xué)習(xí)與計(jì)算機(jī)專家,香港中文大學(xué)教授,他是商湯聯(lián)合創(chuàng)始人,也是商湯創(chuàng)始人湯曉鷗的學(xué)生,是國際上最具影響力的視覺算法開源項(xiàng)目OpenMMLab的主導(dǎo)發(fā)起人。在大模型時(shí)代,他帶領(lǐng)了書生·浦語InternLM開源大模型體系以及OpenCompass司南大模型評測體系的研發(fā)工作。
林達(dá)華預(yù)估,第一季度左右,各家都會(huì)對大模型上下文窗口兆級能力“亮劍”。
同時(shí),他表達(dá)了與月之暗面同樣的態(tài)度,即大海撈針其實(shí)沒有那么難。
難的是海里不止一根針,應(yīng)有無數(shù)的碎片化信息藏在各個(gè)地方,(大模型)把所有東西串接一起,做比較深層次的結(jié)論。就像讀福爾摩斯偵探小說,讀完后綜合判斷兇手是誰——這就不是一個(gè)簡單的檢索問題。
近期,各家大模型于長文本賽道上卷生卷死,但是否應(yīng)把它作為最主要的方向去打磨,大家有不同的判斷。
林達(dá)華點(diǎn)出,應(yīng)該要評估衡量超長文本能力的計(jì)算代價(jià),“無損長上
原文鏈接:兆級長文本,已是一線大模型機(jī)構(gòu)標(biāo)配能力丨上海AI Lab林達(dá)華
聯(lián)系作者
文章來源:量子位
作者微信:QbitAI
作者簡介:追蹤人工智能新趨勢,關(guān)注科技行業(yè)新突破