<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        英特爾至強(qiáng)6獨(dú)享MRDIMM,內(nèi)存帶寬飆升,加速推理達(dá)2.4倍!

        AIGC動(dòng)態(tài)5個(gè)月前發(fā)布 新智元
        486 0 0

        在解決了「能或不能」的問題之后,推理成本是大語言模型落地最后最關(guān)鍵的挑戰(zhàn)

        英特爾至強(qiáng)6獨(dú)享MRDIMM,內(nèi)存帶寬飆升,加速推理達(dá)2.4倍!

        原標(biāo)題:英特爾至強(qiáng)6獨(dú)享MRDIMM,內(nèi)存帶寬飆升,加速推理達(dá)2.4倍!
        文章來源:新智元
        內(nèi)容字?jǐn)?shù):7605字

        英特爾至強(qiáng)6性能核處理器:內(nèi)存帶寬升級(jí)與大模型推理

        本文總結(jié)了新智元報(bào)道中關(guān)于英特爾至強(qiáng)6性能核處理器(特別是6980P和6972P型號(hào))的關(guān)鍵信息,重點(diǎn)關(guān)注其內(nèi)存帶寬提升對(duì)大語言模型推理性能的影響。

        1. 架構(gòu)分析與內(nèi)核數(shù)量

          文章推測至強(qiáng)6性能核處理器的芯片布局更接近5×10,而非之前的預(yù)測5×9。每個(gè)芯片約有44個(gè)內(nèi)核,通過屏蔽少量內(nèi)核構(gòu)成不同的型號(hào),例如128核的6980P。值得注意的是,內(nèi)存控制器區(qū)域比預(yù)期大得多,占據(jù)6個(gè)網(wǎng)格,這引發(fā)了關(guān)于其額外功能(例如MRDIMM支持)的猜測。

        2. NUMA與集群模式

          至強(qiáng)6性能核處理器支持不同的NUMA(非統(tǒng)一內(nèi)存訪問)模式,包括SNC3 Mode(每個(gè)計(jì)算單元芯片作為一個(gè)SNC)和HEX Mode(訪問所有內(nèi)存)。SNC3 Mode是默認(rèn)模式,適合虛擬化、容器化應(yīng)用和并行計(jì)算;HEX Mode則更適合大型數(shù)據(jù)庫、部分科學(xué)計(jì)算和CXL內(nèi)存擴(kuò)展場景。不同模式的內(nèi)存訪問時(shí)延差異較大,與內(nèi)核和內(nèi)存控制器之間的距離相關(guān)。

        3. MRDIMM:內(nèi)存帶寬的顯著提升

          至強(qiáng)6性能核處理器獨(dú)占性地支持MRDIMM(多路復(fù)用數(shù)據(jù)緩沖器),大幅提升內(nèi)存帶寬。MRDIMM通過多路復(fù)用數(shù)據(jù)緩沖器(MDB)和改進(jìn)的寄存時(shí)鐘驅(qū)動(dòng)器(MRCD)實(shí)現(xiàn)帶寬翻倍。更高的內(nèi)存容量(例如使用256GB MRDIMM)也進(jìn)一步增強(qiáng)了其優(yōu)勢,尤其利好AI訓(xùn)練和大型數(shù)據(jù)庫應(yīng)用。雖然輕量級(jí)應(yīng)用可能無法充分利用MRDIMM的帶寬提升,但對(duì)于計(jì)算密集型應(yīng)用(如加密、科學(xué)計(jì)算、AI訓(xùn)練和推理)則有顯著益處。

        4. 內(nèi)存帶寬與大模型推理

          文章指出,大語言模型推理對(duì)內(nèi)存帶寬的需求非常高。在測試中,大語言模型推理性能提升超過30%,而傳統(tǒng)推理任務(wù)的提升較小。以Llama3 8B模型為例,至強(qiáng)6972P(96核)的推理性能是至強(qiáng)8592+(64核)的2.4倍以上,這主要?dú)w功于內(nèi)存帶寬的顯著提升(約為2.4倍),而非單純的內(nèi)核數(shù)量增加。在算力非瓶頸的情況下,內(nèi)存容量和帶寬決定了模型規(guī)模上限和token輸出上限。

        5. 結(jié)語:推理成本的挑戰(zhàn)與解決方案

          至強(qiáng)6性能核處理器結(jié)合MRDIMM,在內(nèi)存帶寬和容量方面取得了顯著進(jìn)步,這對(duì)于大語言模型推理等應(yīng)用至關(guān)重要。在解決了“能或不能”的問題后,推理成本成為大語言模型落地的關(guān)鍵挑戰(zhàn)。至強(qiáng)6性能核處理器配MRDIMM的組合,為降低推理成本提供了新的思路,并為科學(xué)計(jì)算、大型數(shù)據(jù)庫等傳統(tǒng)重負(fù)荷領(lǐng)域帶來了顯著益處。CXL內(nèi)存擴(kuò)展技術(shù)更能進(jìn)一步提升性能。


        聯(lián)系作者

        文章來源:新智元
        作者微信:
        作者簡介:智能+中國主平臺(tái),致力于推動(dòng)中國從互聯(lián)網(wǎng)+邁向智能+新紀(jì)元。重點(diǎn)關(guān)注人工智能、機(jī)器人等前沿領(lǐng)域發(fā)展,關(guān)注人機(jī)融合、人工智能和機(jī)器人對(duì)人類社會(huì)與文明進(jìn)化的影響,領(lǐng)航中國新智能時(shí)代。

        閱讀原文
        ? 版權(quán)聲明
        Trae官網(wǎng)

        相關(guān)文章

        Trae官網(wǎng)

        暫無評(píng)論

        暫無評(píng)論...
        主站蜘蛛池模板: 毛片基地看看成人免费| 亚洲成AV人综合在线观看| www亚洲精品久久久乳| 亚洲乱码中文字幕综合| 18禁超污无遮挡无码免费网站国产| 一级女性全黄久久生活片免费| 亚洲中文字幕久久精品无码2021| 亚洲人成精品久久久久| 内射无码专区久久亚洲| 在线免费观看视频你懂的| 亚洲一级特黄特黄的大片| 日本人的色道www免费一区| 免费的黄色的网站| 亚洲日韩精品无码专区| 亚洲欧洲日韩在线电影| 亚洲欧洲第一a在线观看| 国产99视频精品免费观看7| 日韩免费视频一区二区| 亚洲精品成a人在线观看☆| 亚洲国产成a人v在线| 久久精品国产亚洲av高清漫画| 国产亚洲精品一品区99热| 亚洲欧洲精品成人久久曰影片| 国产成人精品男人免费| 日韩成人在线免费视频| 精品国产免费观看| 全免费a级毛片免费看无码| 欧美a级成人网站免费| 妻子5免费完整高清电视| 国产va免费精品观看精品| 美女视频黄免费亚洲| 一二三四在线观看免费高清中文在线观看| 99热在线免费播放| 中文字幕视频免费| 最近免费视频中文字幕大全| 久久精品无码专区免费青青| 中文字幕亚洲免费无线观看日本 | 99久9在线|免费| 18以下岁毛片在免费播放| 亚洲网站免费观看| 无限动漫网在线观看免费|