<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        單卡跑Llama 70B快過雙卡,微軟硬生生把FP6搞到了A100里 | 開源

        AIGC動(dòng)態(tài)1年前 (2024)發(fā)布 量子位
        555 0 0

        單卡跑Llama 70B快過雙卡,微軟硬生生把FP6搞到了A100里 | 開源

        AIGC動(dòng)態(tài)歡迎閱讀

        原標(biāo)題:?jiǎn)慰ㄅ躄lama 70B快過雙卡,微軟硬生生把FP6搞到了A100里 | 開源
        關(guān)鍵字:權(quán)重,精度,模型,團(tuán)隊(duì),微軟
        文章來源:量子位
        內(nèi)容字?jǐn)?shù):4084字

        內(nèi)容摘要:


        克雷西 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAIFP8和更低的浮點(diǎn)數(shù)量化精度,不再是H100的“專利”了!
        老黃想讓大家用INT8/INT4,微軟DeepSpeed團(tuán)隊(duì)在沒有英偉達(dá)官方支持的條件下,硬生生在A100上跑起FP6。
        測(cè)試結(jié)果表明,新方法TC-FPx在A100上的FP6量化,速度接近甚至偶爾超過INT4,而且擁有比后者更高的精度。
        在此基礎(chǔ)之上,還有端到端的大模型支持,目前已經(jīng)開源并集成到了DeepSpeed等深度學(xué)習(xí)推理框架中。
        這一成果對(duì)大模型的加速效果也是立竿見影——在這種框架下用單卡跑Llama,吞吐量比雙卡還要高2.65倍。
        一名機(jī)器學(xué)習(xí)研究人員看了后表示,微軟的這項(xiàng)研究簡(jiǎn)直可以用crazy來形容。
        表情包也第一時(shí)間上線,be like:
        英偉達(dá):只有H100支持FP8。
        微軟:Fine,我自己搞定。
        那么,這個(gè)框架到底能實(shí)現(xiàn)什么樣的效果,背后又采用了什么樣的技術(shù)呢?
        用FP6跑Llama,單卡比雙卡還快在A100上使用FP6精度,帶來的是內(nèi)核級(jí)的性能提升。
        研究人員選取了不同大小的Llama模型和OPT模型之中的線性層,在NVIDIA A100-40GB G


        原文鏈接:單卡跑Llama 70B快過雙卡,微軟硬生生把FP6搞到了A100里 | 開源

        聯(lián)系作者

        文章來源:量子位
        作者微信:QbitAI
        作者簡(jiǎn)介:追蹤人工智能新趨勢(shì),關(guān)注科技行業(yè)新突破

        閱讀原文
        ? 版權(quán)聲明
        蟬鏡AI數(shù)字人

        相關(guān)文章

        蟬鏡AI數(shù)字人

        暫無評(píng)論

        暫無評(píng)論...
        主站蜘蛛池模板: 性感美女视频在线观看免费精品 | 免费萌白酱国产一区二区三区 | 亚洲电影中文字幕| 亚洲国产精品美女| 免费人成动漫在线播放r18 | 台湾一级毛片永久免费| 日韩免费观看一级毛片看看| 日韩亚洲欧洲在线com91tv| 亚洲国产夜色在线观看| 一级特黄特色的免费大片视频| 69影院毛片免费观看视频在线| 免费人成视网站在线观看不卡| 久久久久亚洲AV无码麻豆| 日韩欧美亚洲中文乱码| 日韩精品人妻系列无码专区免费 | 国产精品亚洲а∨无码播放不卡| 永久在线免费观看| 91丁香亚洲综合社区| 6080午夜一级毛片免费看| 亚洲av永久无码精品三区在线4 | 国产亚洲福利一区二区免费看| 99久久亚洲精品无码毛片| 很黄很黄的网站免费的| 国产亚洲一区二区三区在线| 曰批免费视频播放在线看片二| 色噜噜亚洲精品中文字幕| 在线观看亚洲视频| 亚洲日韩小电影在线观看| 一道本在线免费视频| 婷婷亚洲综合五月天小说| 成人性生交大片免费看无遮挡 | 免费v片视频在线观看视频| 成人免费777777被爆出| 亚洲成网777777国产精品| 亚洲小说图区综合在线| 91成人免费观看| 亚洲视频免费在线播放| 18禁黄网站禁片免费观看不卡| 中文字幕无码精品亚洲资源网久久| 免费无码A片一区二三区| 一级视频免费观看|