<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        CPU推理提升4到5倍,蘋果用閃存加速大模型推理,Siri 2.0要來了?

        AIGC動態2年前 (2023)發布 機器之心
        557 0 0

        CPU推理提升4到5倍,蘋果用閃存加速大模型推理,Siri 2.0要來了?

        AIGC動態歡迎閱讀

        原標題:CPU推理提升4到5倍,蘋果用閃存加速大模型推理,Siri 2.0要來了?
        關鍵字:閃存,模型,加載,數據,神經元
        文章來源:機器之心
        內容字數:7396字

        內容摘要:


        機器之心報道
        編輯:杜偉、蛋醬蘋果這項新工作將為未來 iPhone 加入大模型的能力帶來無限想象力。近年來,GPT-3、OPT 和 PaLM 等大型語言模型(LLM)在廣泛的 NLP 任務中表現出了強大的性能。不過,這些能力伴隨著大量計算和內存推理需求,畢竟大型語言模型可能包含數千億甚至萬億參數,使得高效加載和運行變得有挑戰性,尤其是在資源有限的設備上。
        當前標準的應對方案是將整個模型加載到 DRAM 中進行推理,然而這種做法嚴重限制了可以運行的最大模型尺寸。舉個例子,70 億參數的模型需要 14GB 以上的內存才能加載半精度浮點格式的參數,這超出了大多數邊緣設備的能力。
        為了解決這種局限性,蘋果的研究者提出在閃存中存儲模型參數,至少比 DRAM 大了一個數量級。接著在推理中,他們直接并巧妙地從閃存加載所需參數,不再需要將整個模型擬合到 DRAM 中。
        這種方法基于最近的工作構建,這些工作表明 LLM 在前饋網絡(FFN)層中表現出高度稀疏性,其中 OPT、Falcon 等模型的稀疏性更是超過 90%。因此,研究者利用這種稀疏性, 有選擇地僅從閃存中加載具有非零輸入或預測具有非零輸出的


        原文鏈接:CPU推理提升4到5倍,蘋果用閃存加速大模型推理,Siri 2.0要來了?

        聯系作者

        文章來源:機器之心
        作者微信:almosthuman2014
        作者簡介:專業的人工智能媒體和產業服務平臺

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 国产gav成人免费播放视频| 国产成人AV免费观看| 99在线视频免费观看视频| 亚洲国产精品不卡在线电影| 一个人看的www免费在线视频| 亚洲精品国产成人中文| 免费观看91视频| 免费看的成人yellow视频| 在线观看日本亚洲一区| 成年18网站免费视频网站| 亚洲国产欧洲综合997久久| 全黄性性激高免费视频| 亚洲狠狠久久综合一区77777| 最好免费观看高清在线| 亚洲国产精品lv| 99久久免费国产精品特黄 | 亚洲色无码专区在线观看| 国产福利在线观看永久免费| 亚洲综合色婷婷七月丁香| 久久免费线看线看| 亚洲六月丁香六月婷婷蜜芽| 人禽杂交18禁网站免费| 国产成人综合亚洲| 五月婷婷综合免费| 亚洲AV综合永久无码精品天堂| 啊灬啊灬别停啊灬用力啊免费看| 国产精品一区二区三区免费 | 在线毛片片免费观看| 亚洲午夜久久久精品电影院| 日本免费电影一区| 中国国产高清免费av片| 亚洲精品中文字幕麻豆| 毛片大全免费观看| 精品国产污污免费网站入口在线| 久久精品亚洲日本佐佐木明希| 日韩一区二区a片免费观看| 一级毛片人与动免费观看| 亚洲精品国产免费| 亚洲国产午夜中文字幕精品黄网站| 久久午夜夜伦鲁鲁片无码免费| 亚洲色精品三区二区一区|