<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        無需額外訓練提升模型30%性能!DeepMind科學家點贊MIT博士生實習成果

        AIGC動態2年前 (2023)發布 量子位
        282 0 0

        無需額外訓練提升模型30%性能!DeepMind科學家點贊MIT博士生實習成果

        AIGC動態歡迎閱讀

        原標題:無需額外訓練提升模型30%性能!DeepMind科學家點贊MIT博士生實習成果
        關鍵字:模型,矩陣,權重,組件,性能
        文章來源:量子位
        內容字數:4117字

        內容摘要:


        豐色 發自 凹非寺量子位 | 公眾號 QbitAI一個來自MIT博士生的驚人發現:
        只需對Transformer的特定層進行一種非常簡單的修剪,即可在縮小模型規模的同時顯著提高模型性能。
        效果主要體現在文本理解任務上,最高可達30%。
        這在3個模型(LLama2、GPT-J和Roberta)和8個不同數據集上都得到了驗證(包含認知推理、世界知識等)。
        除了文本理解,它也適用于強化學習。
        當然,更重要的是,這個操作只需在模型訓練完成之后進行,不需要額外的參數和數據。
        DeepMind研究科學家看完都來點贊了:
        那么,它具體怎么做的?
        方法概述該方法全稱“ Layer-Selective Rank Reduction”,簡稱“LASER”。
        這是一種選擇性地去除LLM權重矩陣高階組件(components)的干預措施,操作就在Transformer模型的特定權重矩陣和層中進行。
        研究發現,即使完全去除90%以上,模型性能一般也不會下降。
        具體而言,LASER通過rank-k近似來替換Transformer模型中的特定權重矩陣(W),有時僅減少包含前1%組件的矩陣,也能達到不錯的效果。
        一個


        原文鏈接:無需額外訓練提升模型30%性能!DeepMind科學家點贊MIT博士生實習成果

        聯系作者

        文章來源:量子位
        作者微信:QbitAI
        作者簡介:追蹤人工智能新趨勢,關注科技行業新突破

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 国产啪亚洲国产精品无码 | 一区二区在线免费观看| 99re这里有免费视频精品 | MM1313亚洲国产精品| 精品一区二区三区免费视频| a拍拍男女免费看全片| 亚洲成AⅤ人影院在线观看| 久久亚洲中文字幕精品有坂深雪 | 亚洲一本之道高清乱码| 日本激情猛烈在线看免费观看 | a毛片久久免费观看| 免费福利电影在线观看| 日韩精品免费电影| 亚洲精品视频在线免费| a毛片免费观看完整| 亚洲国产精品第一区二区| 美女被吸屁股免费网站| 在线视频免费观看爽爽爽| 伊人久久大香线蕉亚洲 | 亚洲日韩在线观看免费视频| 思思99re66在线精品免费观看| 亚洲国产一区二区三区青草影视| 久久免费视频观看| 亚洲国产成人资源在线软件| 国产好大好硬好爽免费不卡| 国产亚洲日韩一区二区三区| 亚洲免费人成在线视频观看| 亚洲国产综合自在线另类| 91精品国产免费网站| 亚洲AV日韩精品久久久久久 | 亚洲国产av高清无码| 日本人的色道www免费一区| h视频在线观看免费| 亚洲综合久久久久久中文字幕| 白白国产永久免费视频| 亚洲AV无码一区二区三区人 | 亚洲精品色在线网站| 久久久久久久尹人综合网亚洲| CAOPORN国产精品免费视频| 久久狠狠高潮亚洲精品| 国产成人免费福利网站|