極長序列、極快速度：面向新一代高效大語言模型的LASP序列并行

AIGC動態(tài)1年前 (2024)發(fā)布機器之心

AIGC動態(tài)歡迎閱讀

原標題：極長序列、極快速度：面向新一代高效大語言模型的LASP序列并行
關鍵字：序列,方法,矩陣,通信,切分
文章來源：機器之心
內容字數：8137字

內容摘要：

AIxiv專欄是機器之心發(fā)布學術、技術內容的欄目。過去數年，機器之心AIxiv專欄接收報道了2000多篇內容，覆蓋全球各大高校與企業(yè)的頂級實驗室，有效促進了學術交流與傳播。如果您有優(yōu)秀的工作想要分享，歡迎投稿或者聯系報道。投稿郵箱：liyazhou@jiqizhixin.com；zhaoyunfeng@jiqizhixin.com。
從國際頂流 GPT-4 128K、Claude 200K 到國內「當紅炸子雞」支持 200 萬字上下文的 Kimi Chat，大語言模型（LLM）在長上下文技術上不約而同地卷起來了。當全世界最聰明的頭腦都在卷一件事的時候，這件事的重要性和難度就自然不言自明。
極長的上下文可以極大拓展大模型的生產力價值。隨著 AI 的普及，用戶已經不再滿足于大模型幾個腦筋急轉彎，用戶開始渴望利用大模型來真正提高生產力。畢竟從前花一周憋出來的 PPT，現在只需要喂給大模型一串提示詞和幾份參考文檔就分分鐘生成出來，打工人誰能不愛呢？
新型高效序列建模方法比如：Lightning Attention (TransNormerLLM), State Space Modeling

原文鏈接：極長序列、極快速度：面向新一代高效大語言模型的LASP序列并行