<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        英偉達玩轉剪枝、蒸餾:把Llama 3.1 8B參數減半,性能同尺寸更強

        AIGC動態9個月前發布 機器之心
        584 0 0

        英偉達玩轉剪枝、蒸餾:把Llama 3.1 8B參數減半,性能同尺寸更強

        AIGC動態歡迎閱讀

        原標題:英偉達玩轉剪枝、蒸餾:把Llama 3.1 8B參數減半,性能同尺寸更強
        關鍵字:模型,準確率,重要性,損失,深度
        文章來源:機器之心
        內容字數:0字

        內容摘要:


        機器之心報道
        編輯:杜偉、陳陳、澤南小模型崛起了。上個月,Meta 發布了 Llama 3.1 系列模型,其中包括 Meta 迄今為止最大的 405B 模型,以及兩個較小的模型,參數量分別為 700 億和 80 億。
        Llama 3.1 被認為是引領了開源新時代。然而,新一代的模型雖然性能強大,但部署時仍需要大量計算資源。
        因此,業界出現了另一種趨勢,即開發小型語言模型 (SLM),這種模型在許多語言任務中表現足夠出色,部署起來也非常便宜。
        最近,英偉達研究表明,結構化權重剪枝與知識蒸餾相結合,可以從初始較大的模型中逐步獲得較小的語言模型。圖靈獎得主、Meta 首席 AI 科學家 Yann LeCun 也點贊轉帖了該研究。
        經過剪枝和蒸餾,英偉達研究團隊將 Llama 3.1 8B 提煉為 Llama-3.1-Minitron 4B 開源了出來。這是英偉達在 Llama 3.1 開源系列中的第一個作品。
        Llama-3.1-Minitron 4B 的表現優于類似大小的最先進的開源模型,包括 Minitron 4B、Phi-2 2.7B、Gemma2 2.6B 和 Qwen2-1.5B。


        原文鏈接:英偉達玩轉剪枝、蒸餾:把Llama 3.1 8B參數減半,性能同尺寸更強

        聯系作者

        文章來源:機器之心
        作者微信:
        作者簡介:

        閱讀原文
        ? 版權聲明
        Trae官網

        相關文章

        Trae官網

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 四虎永久免费观看| 欧洲乱码伦视频免费| 亚洲成AV人在线观看网址| 亚洲av色香蕉一区二区三区蜜桃| 亚洲国产精品久久久久久| 亚洲精品无码一区二区| 日韩成人免费在线| 78成人精品电影在线播放日韩精品电影一区亚洲 | 国产亚洲大尺度无码无码专线 | 日韩一区二区在线免费观看 | 不卡精品国产_亚洲人成在线| 四虎影视久久久免费观看| 亚洲免费视频一区二区三区| 亚洲中文久久精品无码1| 成人网站免费观看| 亚洲日韩图片专区第1页| 无码国产精品一区二区免费式芒果 | 亚洲天然素人无码专区| 日韩黄色免费观看| 成人在线免费视频| 亚洲第一视频网站| 国产美女在线精品免费观看| 国产精品亚洲二区在线| 精品亚洲一区二区三区在线观看 | 成人午夜亚洲精品无码网站| 免费成人在线视频观看| 亚洲午夜国产精品| 免费一级特黄特色大片在线| 中文在线观看永久免费| 亚洲国产人成在线观看| 免费国产成人高清在线观看麻豆 | 91视频免费观看高清观看完整| 亚洲高清视频免费| 国产免费资源高清小视频在线观看| www在线观看免费视频| 亚洲欧洲视频在线观看| 无码人妻久久一区二区三区免费| 亚洲午夜无码毛片av久久京东热| 亚洲午夜精品第一区二区8050| 免费国产污网站在线观看15| 麻豆亚洲AV成人无码久久精品|