<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        “梁文鋒、楊植麟同一天文,關注大模型的未來趨勢“

        “梁文鋒、楊植麟同一天發論文,關注大模型的未來趨勢“

        原標題:“梁文鋒、楊植麟同一天文,關注大模型的未來趨勢“
        文章來源:人工智能學家
        內容字數:14427字

        兩家AI公司聚焦長文本處理:DeepSeek和月之暗面最新研究成果對比

        近日,DeepSeek和月之暗面(Moonshot AI)幾乎同時發布了各自最新的研究成果,都集中于改進Transformer架構中的注意力機制,以提升其處理長文本的能力并降低計算成本。這體現了業界對高效處理長文本的迫切需求,也反映了技術創新競爭的激烈程度。兩家公司的明星創始人均親自參與了研究,引發了廣泛關注。

        1. Transformer架構的瓶頸:長文本處理的挑戰

        Transformer架構雖然是AI發展史上的里程碑,但其注意力機制的計算復雜度與輸入序列長度的平方成正比(O(n2))。這意味著處理長文本(例如超過1萬個token)的計算成本和內存占用會急劇增加,成為模型進一步擴展和提升能力的主要障礙。

        2. DeepSeek的NSA:原生可訓練的稀疏注意力機制

        DeepSeek的論文《Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention》提出了原生可訓練的稀疏注意力機制NSA (Natively Trainable Sparse Attention)。NSA通過動態分層稀疏策略,結合粗粒度token壓縮和細粒度token選擇,實現了對長上下文的高效建模。其核心在于減少不必要的計算,在保持性能的同時提升速度。NSA具有兩大創新:

        1. 算法優化:NSA設計了一種平衡計算強度的算法,并針對現代硬件進行了優化,類似于高效閱讀,只關注重要部分。
        2. 端到端訓練:NSA允許模型從頭到尾進行訓練,無需額外計算步驟,減少訓練時間并提升模型表現。

        實驗表明,NSA在多個任務上表現出色,在處理64k長度序列時,解碼、前向傳播和后向傳播分別實現了2.5倍、3.1倍和2.8倍的加速,同時保持了與全注意力模型相當甚至更好的性能。

        3. 月之暗面的MoBA:混合塊注意力架構

        月之暗面的論文《MoBA: Mixture of Block Attention for Long-Context LLMs》提出了混合塊注意力架構MoBA (Mixture of Block Attention)。MoBA同樣旨在解決長文本處理的計算瓶頸,其核心思想是讓模型自己決定關注哪些部分,而不是人為規定。MoBA借鑒了“專家混合(MoE)”的思想,靈活地在全注意力和稀疏注意力之間切換,在保持性能的同時顯著降低了計算量。

        MoBA已經被應用于月之暗面的AI助手Kimi中,幫助其更好地處理長文本請求,例如總結長篇小說。

        4. 兩家公司在模型架構上的“撞車”與思維鏈的探索

        這并非DeepSeek和月之暗面第一次在核心思想上“撞車”。此前,DeepSeek發布R1時,Kimi也公開了K1.5的技術報告,兩者的目標都是通過強化學習提升AI的推理能力,尤其是在思維鏈學習(COT)方面的應用。OpenAI在其論文中也提到了DeepSeek-R1和Kimi K1.5,認可了它們在推理能力方面的成就,并強調了COT方法的重要性。

        DeepSeek和月之暗面在長文本處理和推理能力提升上的持續探索,預示著AI模型創新正朝著更有效率、更強大的方向發展。


        聯系作者

        文章來源:人工智能學家
        作者微信:
        作者簡介:致力成為權威的人工智能科技媒體和前沿科技研究機構

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 成年大片免费视频| 华人在线精品免费观看| 国产亚洲精AA在线观看SEE| 国产精品亚洲二区在线| 妞干网免费视频观看| 伊人久久亚洲综合影院首页| 最新仑乱免费视频| 亚洲欧美日韩中文字幕在线一区| 久久久久国色av免费看| 亚洲中文久久精品无码| 免费一级不卡毛片| 日本亚洲国产一区二区三区| 精品国产免费人成网站| 中文字幕乱码免费视频| 亚洲专区中文字幕| 在线观看免费毛片| 日韩在线视频线视频免费网站| 亚洲欧美日韩一区二区三区| 曰批全过程免费视频在线观看| 又黄又爽无遮挡免费视频| av成人免费电影| 亚洲AV无码不卡在线播放| 13一14周岁毛片免费| 国产亚洲精品AA片在线观看不加载| 免费永久在线观看黄网站| 亚洲美女视频网站| 免费大片黄在线观看| 亚洲精品无码国产| 黄色网址免费观看| 日韩亚洲综合精品国产| 亚洲成A人片在线观看无码不卡| 亚洲国产成人久久综合一| 91手机看片国产永久免费| 亚洲国产成人无码AV在线影院| 久久久高清日本道免费观看| 亚洲国产精品成人精品小说| 免费成人在线电影| 亚洲熟妇无码一区二区三区导航| 4399影视免费观看高清直播| 亚洲欧美国产国产一区二区三区 | h视频在线免费看|