国产精品亚洲mnbav网站_成人午夜亚洲精品无码网站_日韩va亚洲va欧洲va国产_亚洲欧洲精品成人久久曰影片

清華&面壁開源高效壓縮技術:一塊 80 G A100 輕松加載 50 個 7B 模型

AIGC動態12個月前發布 AI前線
316 0 0

作者 | OpenBMB 開源社區 近日,清華大學與面壁智能團隊提出了 Delta Compression(Delta 壓縮)技術,它通過存儲主干模型與任務專用模型之間的參數差值,顯著降低了模型對顯卡的存儲需求。在此基礎上,團隊進一步結合低秩分解與低比特量化,提出混合精度壓縮方法 Delta-CoMe。該方法在幾乎不損失任務性能(如數學推理、代碼生成和多模態任務)的前提下,大幅提升了模型推理效率,從而實現一塊 80G A100 GPU 無損性能加載多達 50 個 7B 模型。相比于傳統的微調方法,Delta-CoMe 展現出了更高的效率和靈活性,該技術有效改善了不同應用場景對模型進行微調時的計算與存儲開銷難題,為終端設備帶來了輕量化的大模型推理能力,同時為大模型在多任務、多租戶、端側場景的模型部署提供了全新的低成本、高效率解決方案。下一步或許我們正在邁向一個“模型共享”而非“模型堆疊”的時代,讓每個參數都發揮最大效能,讓每臺設備都能加載無限可能。? 論文鏈接:? https://arxiv.org/abs/2406.08903 ? GitHub 地址:?https://github.com/thunlp/Delta-CoMe
Delta-CoMe 方法介紹
微調是增強預訓練模型的重要手段,不同任務往往需要不同的微調方式。例如 Luo et al.[1] 提出 RLEIF 通過 Evove-instruction 來增強模型數學推理能力;Wei et al.[2] 利用 Code snnipet 合成高質量的指令數據來增加模型的代碼能力。然而,這些方法通常依賴高質量數據,并需要精心設計的策略才能實現顯著的效果。在一些場景中往往需要具有不同能力的 LLM 同時處理問題,例如多租戶場景、多任務場景以及端側場景等等。一種自然的解決方案是部署單個通用模型,以及多個具有專有能力的 Delta。以 Bitdelta[3] 為例,它通過將模型的 Delta 壓縮到 1bit,有效保留了模型在日常對話場景中的基本功能。盡管壓縮方法在存儲和推理效率上表現出色,其在更復雜的任務(如數學推理和代碼生成)上仍存在明顯的能力瓶頸。針對這一挑戰,清華 NLP 實驗室聯合北京大學和上海財經大學提出 Delta-CoMe。這一方法結合低秩和低比特量化技術,不僅顯著提升了模型在復雜任務上的表現,還兼顧了壓縮效率和實際應用需求,為模型的高效部署提供了一種新思路。與前人的方法相比,Delta-CoMe 方法的優點在于:結合低秩與低比特量化,利用了 Delta 低秩的特點,并發現低秩分解后的 Delta 是長尾分布的;之后采用混合精度量化進一步節省;性能幾乎無損,相比于 Bitdelta 等方法,在 math,code,Multi-modal 等復雜任務上,性能與原始模型表現基本接近;推理速度提升,實現了 Triton kernel 對比 Pytorch 實現方式,帶來近 3x 的推理速度提升;超過 Delta-tuning 支持多精度 Backbone,Delta-CoMe 顯著優于 Delta-tuning 并可以用在多種精度的 Backbone 上。Delta-CoMe 首先采用 SVD 進行低秩分解,Delta 具有低秩性,秩降低到原來的 1/8 性能基本保持不變。經過低秩分解之后,我們發現奇異向量是長尾分布的,較大奇異向量對最終的結果貢獻較大。一個自然的想法,我們可以根據奇異向量大小進行混合精度量化,將較大的奇異值對應的奇異向量用較高精度表示。
實驗結果
多個開源模型和 Benchmark 的實驗驗證了該方法的有效性。使用 Llama-2-7B 作為主干模型,在數學、代碼、對話、多模態等多個任務中進行實驗,Delta-CoMe 展現出平均幾乎無損的性能。此外,實驗還在 Mistral、Llama-3 等其它主干模型上進行驗證。通過實現 Triton kernel,相比于 Pytorch 的實現方式,推理速度提升了約 3 倍。實驗結果表明,使用一塊 80G 的 A100 GPU 可以加載 50 個 7B 模型。Delta-CoMe 對比 Delta-tuning 在相同的存儲開銷下,性能顯著提升。
總 結
Delta-CoMe 通過結合低秩分解和低比特量化,不僅實現了大幅度的存儲壓縮,還在復雜任務如數學推理、代碼生成和多模態任務上維持了與原始模型相當的性能表現。相比于傳統的微調方法,Delta-CoMe 展現出了更高的效率和靈活性,尤其在多租戶和多任務場景中具有顯著的應用價值。此外,借助 Triton kernel 的優化,推理速度得到了顯著提升,使得部署大規模模型成為可能。未來,這一方法的潛力不僅在于進一步優化模型存儲和推理速度,也有望在更廣泛的實際應用中推動大語言模型的普及和高效運作。參考文獻[1]Yu, L., Jiang, W., Shi, H., Jincheng, Y., Liu, Z., Zhang, Y., Kwok, J., Li, Z., Weller, A., and Liu, W.Metamath: Bootstrap your own mathematical questions for large language models. In The Twelfth International Conference on Learning Representations, 2023.[2] Luo, Z., Xu, C., Zhao, P., Sun, Q., Geng, X., Hu, W., Tao, C., Ma, J., Lin, Q., and Jiang, D. Wizardcoder: Empowering code large language models with evol-instruct. arXiv preprint arXiv:2306.08568, 2023b[3] Liu, J., Xiao, G., Li, K., Lee, J. D., Han, S., Dao, T., and Cai, T. Bitdelta: Your fine-tune may only be worth one bit. arXiv preprint arXiv:2402.10193, 2024b.InfoQ 老友!請留步!極客邦 1 號客服上線工作啦!后續我將通過微信視頻號,以視頻的形式持續更新技術話題、未來發展趨勢、創業經驗、商業踩坑教訓等精彩內容,和大家一同成長,開啟知識交流之旅歡迎掃碼關注我的微信視頻號~會議推薦12 月 13 日至 14 日(下周五至周六),AICon 全球人工智能開發與應用大會將在北京盛大開幕!本次大會匯聚 70+ 位 AI 及技術領域的頂尖專家,深入探討大模型與推理、AI Agent、多模態、具身智能等前沿話題。此外還有豐富的圓桌論壇、以及展區活動,帶你深入探索大模型的最新實踐與未來趨勢。年度最后一次 AI 盛宴,讓我們一起見證 AI 未來。今日薦文裁掉 1.5 萬人后,英特爾傳奇 CEO :18 歲入職,風雨 40 載,如今成了“背鍋俠”?四年詐騙投資人千萬美元,哈佛系 AI 公司創始人被捕!曾榮登福布斯榜,如今面臨 42 年監禁北京一AI創業公司招0薪CTO;網易否認深圳公司全部裁員;94歲巴菲特公布后事安排 |AI周報又又又給 AI 發明新語言了!卡內基梅隆大學讓計算機理解人的想法后自動 coding,結果翻車了!AI 監工軟件盯梢員工太瘋狂:5 秒截屏,打字慢、上網久都拿“紅牌”!網友狂噴,但巨頭爭相使用你也「在看」嗎??

閱讀原文
? 版權聲明
蟬鏡AI數字人

相關文章

蟬鏡AI數字人

暫無評論

暫無評論...
国产精品亚洲mnbav网站_成人午夜亚洲精品无码网站_日韩va亚洲va欧洲va国产_亚洲欧洲精品成人久久曰影片
<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        欧美一级视频精品观看| 97成人超碰视| 91一区二区在线| 久久女同精品一区二区| 成人综合激情网| 一区二区三区视频在线观看| 色婷婷久久一区二区三区麻豆| 亚洲中国最大av网站| 91 com成人网| av激情综合网| 日欧美一区二区| 日本一区二区三区免费乱视频| 91麻豆国产在线观看| 日韩黄色免费网站| 国产精品激情偷乱一区二区∴| 欧美在线你懂的| 综合色天天鬼久久鬼色| 91浏览器在线视频| 精品一二线国产| 一区二区三区高清不卡| 久久九九国产精品| 欧美日韩综合在线免费观看| 国产高清不卡一区| 一区二区三区日韩精品| 国产婷婷精品av在线| 欧美一区二区三区免费观看视频 | 免费精品视频在线| 国产精品久久久久久久岛一牛影视| 欧美二区三区91| 一本大道久久a久久精二百| 久草精品在线观看| 亚洲mv大片欧洲mv大片精品| 中文字幕中文字幕一区二区| 日韩免费视频一区二区| 95精品视频在线| 国产99久久久国产精品免费看 | 亚洲午夜视频在线观看| 国产女主播一区| 精品国精品国产尤物美女| 91福利资源站| 91女厕偷拍女厕偷拍高清| 国产在线看一区| 美日韩一区二区| 午夜精品视频在线观看| 亚洲一区二区三区小说| 亚洲女与黑人做爰| 综合中文字幕亚洲| 最新高清无码专区| 国产精品国产三级国产aⅴ入口| 久久噜噜亚洲综合| 精品欧美一区二区久久| 欧美丰满少妇xxxbbb| 欧美日韩色一区| 8x福利精品第一导航| 欧美一区日本一区韩国一区| 欧美一区永久视频免费观看| 5月丁香婷婷综合| 7777精品伊人久久久大香线蕉最新版| 色88888久久久久久影院按摩| 91视视频在线直接观看在线看网页在线看| 成人精品鲁一区一区二区| 国产成人日日夜夜| 不卡av在线网| 91行情网站电视在线观看高清版| 欧美性色黄大片| 宅男在线国产精品| 精品国产人成亚洲区| 国产视频一区二区三区在线观看| 久久精品夜色噜噜亚洲a∨| 国产欧美日韩卡一| 亚洲欧美成人一区二区三区| 一区二区三区四区蜜桃| 午夜国产不卡在线观看视频| 美脚の诱脚舐め脚责91| 国产乱色国产精品免费视频| 99久久精品免费看| 欧美日韩一区二区三区视频| 日韩精品一区国产麻豆| 中文字幕精品一区| 亚洲第一二三四区| 国产精品一二三| 色天天综合色天天久久| 欧美夫妻性生活| 国产欧美精品日韩区二区麻豆天美| 中文字幕精品一区| 污片在线观看一区二区| 国产一区二区三区免费看| 99re这里都是精品| 日韩午夜小视频| 亚洲精品伦理在线| 国产在线播放一区三区四| 色婷婷综合久久久| 久久久久成人黄色影片| 午夜精品久久久久影视| 豆国产96在线|亚洲| 日韩午夜在线观看| 亚洲一区二区精品视频| 国产福利一区在线观看| 欧美日韩国产免费一区二区 | 久久97超碰国产精品超碰| 色综合中文综合网| 亚洲精品在线一区二区| 亚洲蜜臀av乱码久久精品| 美女视频一区二区三区| 91丨porny丨国产| 久久亚洲综合av| 日本在线观看不卡视频| 99re免费视频精品全部| 久久久99精品久久| 久久激五月天综合精品| 欧美人妇做爰xxxⅹ性高电影| 亚洲人成网站在线| 国产不卡视频在线播放| 精品免费日韩av| 日韩国产精品久久| 欧美午夜电影网| 亚洲制服欧美中文字幕中文字幕| www.色精品| 国产精品免费看片| 国产成a人无v码亚洲福利| 欧美精品一区二区三区一线天视频| 亚洲成人免费视| 欧美日韩一区高清| 亚洲影院理伦片| 欧美亚洲丝袜传媒另类| 亚洲欧美经典视频| 色婷婷av一区二区三区软件| 亚洲蜜桃精久久久久久久| 99re这里只有精品视频首页| 国产精品不卡在线观看| 99视频精品在线| 一区二区三区四区亚洲| 欧美日韩在线播放三区| 午夜免费久久看| 日韩视频国产视频| 国产伦精品一区二区三区在线观看| 精品国产凹凸成av人网站| 国产一区高清在线| 中文字幕av不卡| 91蜜桃传媒精品久久久一区二区| 亚洲精选免费视频| 欧美夫妻性生活| 国产乱妇无码大片在线观看| 国产精品美女久久久久高潮| 91丨porny丨户外露出| 亚洲国产精品久久艾草纯爱| 欧美一级久久久久久久大片| 国产在线不卡视频| 亚洲欧美另类久久久精品| 欧美猛男超大videosgay| 久久精品国产亚洲一区二区三区| 久久久亚洲国产美女国产盗摄| www.欧美.com| 日本午夜一区二区| 亚洲国产成人在线| 欧美无乱码久久久免费午夜一区| 免费成人av在线| 国产精品久线在线观看| 6080国产精品一区二区| 国产经典欧美精品| 亚洲一区二三区| 国产亚洲综合在线| 欧美性生交片4| 福利一区二区在线| 日韩电影免费一区| 亚洲人成人一区二区在线观看 | 波多野结衣亚洲一区| 亚洲va欧美va人人爽| 国产欧美一区二区精品性| 91成人在线精品| 国产九九视频一区二区三区| 一区二区三区日韩欧美精品| 2024国产精品| 欧美剧情电影在线观看完整版免费励志电影| 国内精品久久久久影院色| 亚洲午夜久久久久久久久电影网 | 美女视频网站黄色亚洲| 亚洲欧美日韩一区二区三区在线观看| 日韩午夜激情av| 91久久人澡人人添人人爽欧美 | 日韩欧美视频在线| 在线观看www91| 99国产精品99久久久久久| 精东粉嫩av免费一区二区三区| 亚洲精品菠萝久久久久久久| 国产午夜三级一区二区三| 日韩欧美精品三级| 欧美日韩精品系列| 91浏览器在线视频| 成人97人人超碰人人99| 国产一区二区三区免费在线观看| 天天色天天爱天天射综合| 一区二区三区中文在线| 自拍偷拍欧美精品| 亚洲欧美中日韩| 国产精品国产三级国产有无不卡 | 精品第一国产综合精品aⅴ| 欧美群妇大交群中文字幕| 欧美午夜精品久久久久久孕妇| 99久久国产免费看|