<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        英偉達玩轉剪枝、蒸餾:把Llama 3.1 8B參數減半,性能同尺寸更強

        AIGC動態9個月前發布 機器之心
        584 0 0

        英偉達玩轉剪枝、蒸餾:把Llama 3.1 8B參數減半,性能同尺寸更強

        AIGC動態歡迎閱讀

        原標題:英偉達玩轉剪枝、蒸餾:把Llama 3.1 8B參數減半,性能同尺寸更強
        關鍵字:模型,準確率,重要性,損失,深度
        文章來源:機器之心
        內容字數:0字

        內容摘要:


        機器之心報道
        編輯:杜偉、陳陳、澤南小模型崛起了。上個月,Meta 發布了 Llama 3.1 系列模型,其中包括 Meta 迄今為止最大的 405B 模型,以及兩個較小的模型,參數量分別為 700 億和 80 億。
        Llama 3.1 被認為是引領了開源新時代。然而,新一代的模型雖然性能強大,但部署時仍需要大量計算資源。
        因此,業界出現了另一種趨勢,即開發小型語言模型 (SLM),這種模型在許多語言任務中表現足夠出色,部署起來也非常便宜。
        最近,英偉達研究表明,結構化權重剪枝與知識蒸餾相結合,可以從初始較大的模型中逐步獲得較小的語言模型。圖靈獎得主、Meta 首席 AI 科學家 Yann LeCun 也點贊轉帖了該研究。
        經過剪枝和蒸餾,英偉達研究團隊將 Llama 3.1 8B 提煉為 Llama-3.1-Minitron 4B 開源了出來。這是英偉達在 Llama 3.1 開源系列中的第一個作品。
        Llama-3.1-Minitron 4B 的表現優于類似大小的最先進的開源模型,包括 Minitron 4B、Phi-2 2.7B、Gemma2 2.6B 和 Qwen2-1.5B。


        原文鏈接:英偉達玩轉剪枝、蒸餾:把Llama 3.1 8B參數減半,性能同尺寸更強

        聯系作者

        文章來源:機器之心
        作者微信:
        作者簡介:

        閱讀原文
        ? 版權聲明
        Trae官網

        相關文章

        Trae官網

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 100000免费啪啪18免进| 两个人的视频www免费| 嫖丰满老熟妇AAAA片免费看| 亚洲欧洲无码AV电影在线观看| 一区在线免费观看| 全部免费毛片免费播放| 色屁屁www影院免费观看视频| 免费国产高清视频| 国产免费久久久久久无码| 亚洲成a人片在线观看无码专区| 国产精品免费久久久久电影网| 亚洲国产精品碰碰| 久久国产精品免费一区二区三区| 国产综合精品久久亚洲| 久久午夜无码免费| 亚洲视频中文字幕在线| 成人片黄网站色大片免费| 国内成人精品亚洲日本语音| 亚洲七七久久精品中文国产| 黄色网站软件app在线观看免费| 亚洲狠狠久久综合一区77777| 国产精品免费观看| 美女视频免费看一区二区| 综合久久久久久中文字幕亚洲国产国产综合一区首 | 亚洲春色另类小说| 青青草国产免费久久久下载| 免费一级毛suv好看的国产网站 | 午夜老司机永久免费看片| 国产精品亚洲自在线播放页码| 四虎影院免费在线播放| 一区二区3区免费视频| 亚洲ⅴ国产v天堂a无码二区| 四虎国产精品免费久久| 一区二区三区精品高清视频免费在线播放 | 8x网站免费入口在线观看| 四虎必出精品亚洲高清| 亚洲五月午夜免费在线视频| 久久国产色AV免费观看| 国产99久久亚洲综合精品| 亚洲国产高清在线| 在线观着免费观看国产黄|