AIGC動態歡迎閱讀
原標題:兆級長文本,已是一線大模型機構標配能力丨上海AI Lab林達華
關鍵字:模型,林達,騰訊,能力,數據
文章來源:量子位
內容字數:5990字
內容摘要:
衡宇 發自 阿拉上海量子位 | 公眾號 QbitAI“據我了解,國內多個一線大模型機構,都已經突破了兆級的長文本能力。”
以上,是“2024全球開發者先鋒大會”大模型前沿論壇會間隙,上海人工智能實驗室領軍科學家林達華與量子位的交談剪影。
林達華,深度學習與計算機專家,香港中文大學教授,他是商湯聯合創始人,也是商湯創始人湯曉鷗的學生,是國際上最具影響力的視覺算法開源項目OpenMMLab的主導發起人。在大模型時代,他帶領了書生·浦語InternLM開源大模型體系以及OpenCompass司南大模型評測體系的研發工作。
林達華預估,第一季度左右,各家都會對大模型上下文窗口兆級能力“亮劍”。
同時,他表達了與月之暗面同樣的態度,即大海撈針其實沒有那么難。
難的是海里不止一根針,應有無數的碎片化信息藏在各個地方,(大模型)把所有東西串接一起,做比較深層次的結論。就像讀福爾摩斯偵探小說,讀完后綜合判斷兇手是誰——這就不是一個簡單的檢索問題。
近期,各家大模型于長文本賽道上卷生卷死,但是否應把它作為最主要的方向去打磨,大家有不同的判斷。
林達華點出,應該要評估衡量超長文本能力的計算代價,“無損長上
原文鏈接:兆級長文本,已是一線大模型機構標配能力丨上海AI Lab林達華
聯系作者
文章來源:量子位
作者微信:QbitAI
作者簡介:追蹤人工智能新趨勢,關注科技行業新突破
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...