<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        英偉達nGPT重塑Transformer,AI訓練速度暴增20倍!文本越長,加速越快

        AIGC動態7個月前發布 新智元
        554 0 0

        英偉達nGPT重塑Transformer,AI訓練速度暴增20倍!文本越長,加速越快

        AIGC動態歡迎閱讀

        原標題:英偉達nGPT重塑Transformer,AI訓練速度暴增20倍!文本越長,加速越快
        關鍵字:向量,矩陣,模型,球面,注意力
        文章來源:新智元
        內容字數:0字

        內容摘要:


        新智元報道編輯:桃子 LRS
        【新智元導讀】LLM訓練速度還可以再飆升20倍!英偉達團隊祭出全新架構歸一化Transformer(nGPT),上下文越長,訓練速度越快,還能維持原有精度。AI的未來,或許就此改寫……
        最近,英偉達團隊拋出的一枚重磅,提出了全新神經網絡架構——歸一化Transformer(nGPT),基于超球面(hypersphere)進行表示學習。
        相較于Transformer架構本身,nGPT直接將LLM訓練速度提升至高20倍,而且還保持了原有精度。
        也就意味著,原本需要一個月完成的訓練,在未來可能只需1-2天的時間就能搞定。
        無疑為通向AGI終極目標,注入了一針強心劑!
        論文地址:https://arxiv.org/pdf/2410.01131
        在nGPT中,所有的向量(嵌入、MLP、注意力矩陣、隱藏狀態),都被歸一化為單位范數(unit norm)。
        輸入后的token在超球面表面上移動,每一層都通過「位移」來貢獻最終的輸出預測,其中位移量是由MLP和注意力模塊進行定義的,其向量組件都位于同一個超球面上。
        實驗表明,nGPT達到相同精度所需的訓練步驟


        原文鏈接:英偉達nGPT重塑Transformer,AI訓練速度暴增20倍!文本越長,加速越快

        聯系作者

        文章來源:新智元
        作者微信:
        作者簡介:

        閱讀原文
        ? 版權聲明
        Trae官網

        相關文章

        Trae官網

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 亚洲日韩精品无码专区网站| 日韩精品免费一区二区三区| 亚洲精品国产精品乱码不卡√| 免费毛片毛片网址| 免费在线黄色网址| 男男gvh肉在线观看免费| 四虎影在线永久免费四虎地址8848aa | 国产精品亚洲一区二区三区久久| 在线观看特色大片免费视频| 亚洲一级毛片免费看| 日韩一区二区a片免费观看| 亚洲国产精品xo在线观看| 免费三级毛片电影片| 亚洲乱码在线观看| 日韩免费视频在线观看| 精品一区二区三区无码免费直播 | 亚洲精品少妇30p| 国产成人久久AV免费| 亚洲精品无码久久毛片波多野吉衣| 亚洲黄色免费网址| 亚洲kkk4444在线观看| 国产真人无遮挡作爱免费视频| 真人无码作爱免费视频| 久久亚洲AV无码西西人体| 久久午夜无码免费| 亚洲精品456人成在线| 国产精品jizz在线观看免费| 精品熟女少妇aⅴ免费久久| 国产亚洲真人做受在线观看| 久久免费看黄a级毛片| 亚洲成av人片天堂网无码】| 亚洲精品国产精品乱码不卡| 免费视频精品一区二区三区| 亚洲人成毛片线播放| 免费人成网站在线高清| 毛片免费在线观看| 亚洲一区二区三区写真| 亚洲一级毛片中文字幕| 成人五级毛片免费播放| 一级中文字幕乱码免费| 亚洲综合一区二区|