<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        英偉達nGPT重塑Transformer,AI訓練速度暴增20倍!文本越長,加速越快

        AIGC動態7個月前發布 新智元
        554 0 0

        英偉達nGPT重塑Transformer,AI訓練速度暴增20倍!文本越長,加速越快

        AIGC動態歡迎閱讀

        原標題:英偉達nGPT重塑Transformer,AI訓練速度暴增20倍!文本越長,加速越快
        關鍵字:向量,矩陣,模型,球面,注意力
        文章來源:新智元
        內容字數:0字

        內容摘要:


        新智元報道編輯:桃子 LRS
        【新智元導讀】LLM訓練速度還可以再飆升20倍!英偉達團隊祭出全新架構歸一化Transformer(nGPT),上下文越長,訓練速度越快,還能維持原有精度。AI的未來,或許就此改寫……
        最近,英偉達團隊拋出的一枚重磅,提出了全新神經網絡架構——歸一化Transformer(nGPT),基于超球面(hypersphere)進行表示學習。
        相較于Transformer架構本身,nGPT直接將LLM訓練速度提升至高20倍,而且還保持了原有精度。
        也就意味著,原本需要一個月完成的訓練,在未來可能只需1-2天的時間就能搞定。
        無疑為通向AGI終極目標,注入了一針強心劑!
        論文地址:https://arxiv.org/pdf/2410.01131
        在nGPT中,所有的向量(嵌入、MLP、注意力矩陣、隱藏狀態),都被歸一化為單位范數(unit norm)。
        輸入后的token在超球面表面上移動,每一層都通過「位移」來貢獻最終的輸出預測,其中位移量是由MLP和注意力模塊進行定義的,其向量組件都位于同一個超球面上。
        實驗表明,nGPT達到相同精度所需的訓練步驟


        原文鏈接:英偉達nGPT重塑Transformer,AI訓練速度暴增20倍!文本越長,加速越快

        聯系作者

        文章來源:新智元
        作者微信:
        作者簡介:

        閱讀原文
        ? 版權聲明
        Trae官網

        相關文章

        Trae官網

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 91青青国产在线观看免费| 国产精品免费久久久久久久久| 无码AV片在线观看免费| 亚洲色婷婷综合久久| 三根一起会坏掉的好痛免费三级全黄的视频在线观看 | 亚洲欧洲无码一区二区三区| 成人免费视频网站www| 亚洲一区无码中文字幕乱码| 亚洲高清免费在线观看| 亚洲国产精品综合久久网各 | 女性自慰aⅴ片高清免费| 亚洲中文字幕一区精品自拍| 四虎影院免费视频| 亚洲av第一网站久章草| 亚洲国产成人久久笫一页| 高清免费久久午夜精品| 亚洲人成人无码网www电影首页| 国产一区二区三区免费观在线| 国产aⅴ无码专区亚洲av| 日韩免费无码一区二区三区| 亚洲精品91在线| 免费网站看v片在线香蕉| 特色特黄a毛片高清免费观看| 亚洲色WWW成人永久网址| 7x7x7x免费在线观看| 亚洲综合色丁香婷婷六月图片| 国产裸模视频免费区无码| 日本免费精品一区二区三区| 亚洲人成人一区二区三区| 最近2019中文字幕免费大全5| 亚洲 欧洲 自拍 另类 校园| 波多野结衣免费视频观看| 成人网站免费大全日韩国产| 亚洲欧洲精品视频在线观看| 日韩免费高清视频网站| 国产伦精品一区二区免费| 亚洲伊人久久大香线蕉影院| 免费播放春色aⅴ视频| 久久久久国产精品免费看| 亚洲人成色777777精品| 国产V亚洲V天堂无码|