<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        大模型也能切片,微軟SliceGPT讓LLAMA-2計算效率大增

        AIGC動態(tài)2年前 (2024)發(fā)布 機器之心
        557 0 0

        大模型也能切片,微軟SliceGPT讓LLAMA-2計算效率大增

        AIGC動態(tài)歡迎閱讀

        原標(biāo)題:大模型也能切片,微軟SliceGPT讓LLAMA-2計算效率大增
        關(guān)鍵字:模型,矩陣,剪裁,作者,網(wǎng)絡(luò)
        文章來源:機器之心
        內(nèi)容字數(shù):10504字

        內(nèi)容摘要:


        機器之心報道
        編輯:張倩、佳琪刪除權(quán)重矩陣的一些行和列,讓 LLAMA-2 70B 的參數(shù)量減少 25%,模型還能保持 99% 的零樣本任務(wù)性能,同時計算效率大大提升。這就是微軟 SliceGPT 的威力。大型語言模型(LLM)通常擁有數(shù)十億的參數(shù),用了數(shù)萬億 token 的數(shù)據(jù)進行訓(xùn)練,這樣的模型訓(xùn)練、部署成本都非常高。因此,人們經(jīng)常用各種模型壓縮技術(shù)來減少它們的計算需求。
        一般來講,這些模型壓縮技術(shù)可以分為四類:蒸餾、張量分解(包括低秩因式分解)、剪枝和量化。其中,剪枝方法已經(jīng)存在了一段時間,但許多方法需要在剪枝后進行恢復(fù)微調(diào)(RFT)以保持性能,這使得整個過程成本高昂且難以擴展。
        為了解決這一問題,來自蘇黎世聯(lián)邦理工學(xué)院、微軟的研究者提出了一個名為 SliceGPT 的方法。SliceGPT 的核心思想是刪除權(quán)重矩陣中的行和列來降低網(wǎng)絡(luò)的嵌入維數(shù),同時保持模型性能。
        研究人員表示,有了 SliceGPT,他們只需幾個小時就能使用單個 GPU 壓縮大型模型,即使沒有 RFT,也能在生成和下游任務(wù)中保持有競爭力的性能。目前,該論文已經(jīng)被 ICLR 2024 接收。論文標(biāo)題:SLICE


        原文鏈接:大模型也能切片,微軟SliceGPT讓LLAMA-2計算效率大增

        聯(lián)系作者

        文章來源:機器之心
        作者微信:almosthuman2014
        作者簡介:專業(yè)的人工智能媒體和產(chǎn)業(yè)服務(wù)平臺

        閱讀原文
        ? 版權(quán)聲明
        蟬鏡AI數(shù)字人

        相關(guān)文章

        蟬鏡AI數(shù)字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 日韩欧美一区二区三区免费观看| 无码精品人妻一区二区三区免费看| 性盈盈影院免费视频观看在线一区| 亚洲一级片在线播放| 美女视频黄a视频全免费| 亚洲精品电影天堂网| 97在线观免费视频观看| 亚洲国产美女精品久久| 成人免费的性色视频| 亚洲国产乱码最新视频| 日韩免费视频网站| 全部在线播放免费毛片| 亚洲综合久久夜AV | 中文在线观看国语高清免费| 亚洲美女又黄又爽在线观看| 日本免费高清视频| 亚洲婷婷第一狠人综合精品| 日韩免费一级毛片| 一级特黄录像视频免费| 久久亚洲国产伦理| 四虎永久在线精品免费观看视频| 亚洲精品无码av片| 一本色道久久综合亚洲精品高清 | 亚洲中文字幕久久精品无码喷水| 中文字幕不卡免费视频| 亚洲国产成人综合| 国产在线19禁免费观看| 国产99精品一区二区三区免费| 亚洲国产成人高清在线观看 | 嫩草影院免费观看| 中美日韩在线网免费毛片视频| 亚洲日韩v无码中文字幕| 日本最新免费网站| 麻豆安全免费网址入口| 久久久久亚洲AV片无码| 在线观看视频免费国语| 成人无码区免费A∨直播| 456亚洲人成影院在线观| 国产a v无码专区亚洲av| 久久精品免费一区二区| 永久免费精品影视网站|