<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        港中文聯(lián)合MIT提出超長上下文LongLoRA大模型微調(diào)算法

        港中文聯(lián)合MIT提出超長上下文LongLoRA大模型微調(diào)算法

        AIGC動(dòng)態(tài)歡迎閱讀

        原標(biāo)題:港中文聯(lián)合MIT提出超長上下文LongLoRA大模型微調(diào)算法
        關(guān)鍵字:模型,上下文,注意力,長上,方法
        文章來源:大數(shù)據(jù)文摘
        內(nèi)容字?jǐn)?shù):7902字

        內(nèi)容摘要:


        大數(shù)據(jù)文摘受權(quán)轉(zhuǎn)載自將門創(chuàng)投
        現(xiàn)階段,上下文窗口長度基本上成為了評估LLM能力的硬性指標(biāo),上下文的長度越長,代表大模型能夠接受的用戶要求越復(fù)雜,近期OpenAI剛發(fā)布的GPT-4 Turbo模型甚至直接支持到128K的上下文窗口,相當(dāng)于用戶可以直接喂給模型一部長達(dá)300頁的小說。但是從模型實(shí)現(xiàn)角度來看,訓(xùn)練具有長上下文大小的LLM的成本很高。例如在8192的上下文長度上訓(xùn)練參數(shù)規(guī)模相同的模型,自注意力層的計(jì)算成本是2048的16倍。
        本文介紹一篇來自CUHK和MIT合作完成的工作,本文結(jié)合LoRA方法提出了長上下文LLM微調(diào)框架LongLoRA,本文從兩個(gè)方面對LLM的上下文窗口進(jìn)行了優(yōu)化,首先提出了shift short attention(S2-Attn)模塊替代了原始模型推理過程中的密集全局注意力,可以節(jié)省大量的計(jì)算量,同時(shí)保持了與普通注意力微調(diào)相近的性能。此外作者重新審視了LLM上下文窗口參數(shù)的高效微調(diào)機(jī)制,提出了LongLoRA策略,LongLoRA可以在單個(gè)8×A100機(jī)器上實(shí)現(xiàn)LLaMA2-7B模型的上下文從4k擴(kuò)展到100k,或LLaMA2-70B模型的上下文擴(kuò)展到32


        原文鏈接:港中文聯(lián)合MIT提出超長上下文LongLoRA大模型微調(diào)算法

        聯(lián)系作者

        文章來源:大數(shù)據(jù)文摘
        作者微信:BigDataDigest
        作者簡介:普及數(shù)據(jù)思維,傳播數(shù)據(jù)文化

        閱讀原文
        ? 版權(quán)聲明
        Trae官網(wǎng)

        相關(guān)文章

        Trae官網(wǎng)

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 九九美女网站免费| 亚洲成AV人片在线观看无码 | 亚洲精品456播放| 日韩毛片免费无码无毒视频观看| 花蝴蝶免费视频在线观看高清版 | 亚洲精品无码久久毛片| 免费可以在线看A∨网站| 一区二区免费视频| 99久久精品毛片免费播放| 疯狂做受xxxx高潮视频免费| 亚洲一区中文字幕在线电影网 | 久久免费观看国产精品88av| 一级毛片aaaaaa视频免费看| 免费jjzz在线播放国产| 久久久久久久免费视频| 免费播放国产性色生活片| 亚洲性无码一区二区三区| 亚洲影视自拍揄拍愉拍| 亚洲精品456在线播放| 亚洲欧洲免费视频| 久久久久久亚洲精品| 亚洲国产精品高清久久久| 国产gv天堂亚洲国产gv刚刚碰| 亚洲国产午夜福利在线播放 | 无码日韩人妻AV一区免费l| 亚洲αⅴ无码乱码在线观看性色| 国产精品高清视亚洲一区二区 | 成人免费视频软件网站| 国内精品乱码卡1卡2卡3免费| 四虎在线最新永久免费| 在线永久免费的视频草莓| 青青青国产在线观看免费网站| 51精品视频免费国产专区| 最近免费中文字幕mv在线电影| 精品无码AV无码免费专区| 亚洲免费在线观看视频| 国产成人午夜精品免费视频| 久久精品免费一区二区喷潮 | 亚洲成av人片在www鸭子| 小说区亚洲自拍另类| 特级毛片爽www免费版|