<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        陳丹琦團隊新作:Llama-2上下文擴展至128k,10倍吞吐量僅需1/6內存

        AIGC動態1年前 (2024)發布 量子位
        503 0 0

        陳丹琦團隊新作:Llama-2上下文擴展至128k,10倍吞吐量僅需1/6內存

        AIGC動態歡迎閱讀

        原標題:陳丹琦團隊新作:Llama-2上下文擴展至128k,10倍吞吐量僅需1/6內存
        關鍵字:騰訊,模型,上下文,編碼器,解碼器
        文章來源:量子位
        內容字數:4553字

        內容摘要:


        豐色 發自 凹非寺量子位 | 公眾號 QbitAI陳丹琦團隊剛剛發布了一種新的LLM上下文窗口擴展方法:
        它僅用8k大小的token文檔進行訓練,就能將Llama-2窗口擴展至128k。
        最重要的是,在這個過程中,只需要原來1/6的內存,模型就獲得了10倍吞吐量。
        除此之外,它還能大大降低訓練成本:
        用該方法對7B大小的羊駝2進行改造,只需要一塊A100就能搞定。
        團隊表示:
        希望這個方法有用、好用,為未來的LLM們提供廉價又有效的長上下文能力。
        目前,模型和代碼都已在HuggingFace和GitHub上發布。
        只需添加兩個組件這個方法名叫CEPE,全稱“并行編碼上下文擴展(Context Expansion with Parallel Encoding)”。
        作為輕量級框架,它可用于擴展任何預訓練和指令微調模型的上下文窗口。
        對于任何預訓練的僅解碼器語言模型,CEPE通過添加兩個小組件來實現擴展:
        一個是小型編碼器,用于對長上下文進行塊編碼;
        一個是交叉注意力模塊,插入到解碼器的每一層,用于關注編碼器表示。
        完整架構如下:
        在這個示意圖中,編碼器模型并行編碼上下文的3個額外塊,并與


        原文鏈接:陳丹琦團隊新作:Llama-2上下文擴展至128k,10倍吞吐量僅需1/6內存

        聯系作者

        文章來源:量子位
        作者微信:QbitAI
        作者簡介:追蹤人工智能新趨勢,關注科技行業新突破

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 亚洲国产超清无码专区| 亚洲成?v人片天堂网无码| 天天影院成人免费观看| 日韩免费高清大片在线| 成视频年人黄网站免费视频| 国产成人免费a在线资源| 亚洲?V乱码久久精品蜜桃| 亚洲电影中文字幕| 亚洲熟伦熟女专区hd高清| 大片免费观看92在线视频线视频| 在线观看免费播放av片| 成人免费看片又大又黄| 亚洲国产AV无码专区亚洲AV| 亚洲性无码一区二区三区| 暖暖日本免费在线视频 | 亚洲精品乱码久久久久久蜜桃图片| 曰批全过程免费视频免费看| 一区二区免费视频| 一本久到久久亚洲综合| caoporn成人免费公开| 成人性生交大片免费看无遮挡| 亚洲人成人网站色www| 自拍偷自拍亚洲精品偷一| 久久久久久久久久国产精品免费 | 亚洲国产综合人成综合网站| 亚洲最大在线观看| 好吊妞788免费视频播放| 亚洲视频在线免费观看| 成人一级免费视频| 精品亚洲成a人片在线观看少妇| 中国精品一级毛片免费播放| 国产一区二区免费在线| 在线综合亚洲中文精品| 无人在线观看免费高清| 亚洲激情视频图片| 久久精品国产亚洲AV不卡| 亚洲日本VA中文字幕久久道具| 18成禁人视频免费网站| 久久久无码精品亚洲日韩京东传媒| 一级人做人爰a全过程免费视频| 卡1卡2卡3卡4卡5免费视频|