<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        24年對于大模型演進方向的一些思考

        AIGC動態8個月前發布 智猩猩GenAI
        474 0 0

        24年對于大模型演進方向的一些思考

        AIGC動態歡迎閱讀

        原標題:24年對于大模型演進方向的一些思考
        關鍵字:模型,知乎,侵權,框架,編譯器
        文章來源:智猩猩GenAI
        內容字數:0字

        內容摘要:


        導讀文章轉載自知乎,作者為霸王腿,總結了關于大模型計算方式如何變革的一些思路。
        原文地址:https://zhuanlan.zhihu.com/p/682434451
        本文只做學術/技術分享,如有侵權,聯系刪文。大模型計算方式會如何變革,一直是一個持續思考的問題,簡單記錄一些思路,邏輯并不嚴謹,不怕打臉,一年后再看。
        01大模型發展的方向是“稀疏”這里面稀疏指的是,每次執行具體的任務所消耗的資源與整體參數量的比值會越來越低。從以gemm為主到以gemv為主,可以算是一種稀疏(本質上這種稀疏允許了更大的context length的可能性)。MoE毫無疑問也是更稀疏的。從人理解世界的方式而言,稀疏應該是一個比較commen sense的思路。
        02訓練和推理的界限會變得模糊推理的過程中會進行著某種形式的訓練。本質而言,長seq_length帶來的巨大的kv cache就是某種意義上的訓練,但看起來并不是一種足夠高效的方式,所以我感覺這未必會是終極形態。從具體的程序架構而言,在推理的執行模塊,對于每層而言,out=op(in0,in1,attrs) 其中op只改變out的值并不足以作為


        原文鏈接:24年對于大模型演進方向的一些思考

        聯系作者

        文章來源:智猩猩GenAI
        作者微信:
        作者簡介:

        閱讀原文
        ? 版權聲明
        Trae官網

        相關文章

        Trae官網

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 久久国产乱子伦精品免费不卡| 真人无码作爱免费视频| 久久精品中文字幕免费| 国产亚洲精品美女久久久 | 久久久综合亚洲色一区二区三区| 一级做a爰片久久免费| 国产亚洲色婷婷久久99精品91| 一级做a爰黑人又硬又粗免费看51社区国产精品视 | 亚洲中文字幕无码久久综合网| www.xxxx.com日本免费| 亚洲精品成人网久久久久久| 一二三区免费视频| 亚洲中文字幕久久精品无码APP| 免费人成在线观看视频高潮| 亚洲综合一区二区| 最近高清国语中文在线观看免费| 亚洲日韩一区精品射精| 免费亚洲视频在线观看| 一级特黄录像免费播放肥| 亚洲AV中文无码乱人伦下载| 亚洲黄色片免费看| 亚洲人成人伊人成综合网无码| 免费观看毛片视频| 一个人看的免费观看日本视频www| 国产亚洲精AA在线观看SEE| 999任你躁在线精品免费不卡| 亚洲AV无码一区二区三区在线 | 亚洲日产无码中文字幕| 91精品国产免费| 亚洲色大成网站www尤物| 中文字幕在亚洲第一在线| 午夜网站在线观看免费完整高清观看| 亚洲字幕在线观看| 四虎AV永久在线精品免费观看| 你懂的免费在线观看| 亚洲国产成人精品电影| 国产18禁黄网站免费观看| 野花香高清在线观看视频播放免费 | 免费很黄无遮挡的视频毛片| 亚洲大尺度无码无码专区| 国产免费的野战视频|