兆級長文本，已是一線大模型機構標配能力丨上海AI Lab林達華

AIGC動態1年前 (2024)發布量子位

AIGC動態歡迎閱讀

原標題：兆級長文本，已是一線大模型機構標配能力丨上海AI Lab林達華
關鍵字：模型,林達,騰訊,能力,數據
文章來源：量子位
內容字數：5990字

內容摘要：

衡宇發自阿拉上海量子位 | 公眾號 QbitAI“據我了解，國內多個一線大模型機構，都已經突破了兆級的長文本能力。”
以上，是“2024全球開發者先鋒大會”大模型前沿論壇會間隙，上海人工智能實驗室領軍科學家林達華與量子位的交談剪影。
林達華，深度學習與計算機專家，香港中文大學教授，他是商湯聯合創始人，也是商湯創始人湯曉鷗的學生，是國際上最具影響力的視覺算法開源項目OpenMMLab的主導發起人。在大模型時代，他帶領了書生·浦語InternLM開源大模型體系以及OpenCompass司南大模型評測體系的研發工作。
林達華預估，第一季度左右，各家都會對大模型上下文窗口兆級能力“亮劍”。
同時，他表達了與月之暗面同樣的態度，即大海撈針其實沒有那么難。
難的是海里不止一根針，應有無數的碎片化信息藏在各個地方，（大模型）把所有東西串接一起，做比較深層次的結論。就像讀福爾摩斯偵探小說，讀完后綜合判斷兇手是誰——這就不是一個簡單的檢索問題。
近期，各家大模型于長文本賽道上卷生卷死，但是否應把它作為最主要的方向去打磨，大家有不同的判斷。
林達華點出，應該要評估衡量超長文本能力的計算代價，“無損長上

原文鏈接：兆級長文本，已是一線大模型機構標配能力丨上海AI Lab林達華