Network for AI,AI訓練和推理需要新一代的高速網絡;AI for Network,新一代的智能網絡也需要AI,讓網絡更加安全可靠。
原標題:華為王輝:超大規模集群訓推和網絡自動駕駛,是AI在網絡中深度應用的發展方向 | MEET 2025
文章來源:量子位
內容字數:6024字
AI與通信網絡:Network for AI和AI for Network
本文總結了華為NCE數據通信領域總裁王輝在MEET2025智能未來大會上關于AI與通信網絡關系的演講。演講的核心觀點是AI與網絡密不可分,呈現出“Network for AI”和“AI for Network”兩層關系:前者利用網絡加速AI訓練和推理;后者則利用AI提升網絡的智能化、安全性和可靠性。
1. Network for AI:加速AI訓練與推理
AI訓練對算力需求日益增長,從萬卡集群到百萬卡集群,需要整合遠距離分散的算力資源。這需要解決兩個關鍵挑戰:確保大模型訓練長時間穩定,以及實現跨遠距離的算力協同。
為了解決第一個挑戰,華為利用先進算法(如NLSB算法)維持網絡負載均衡,并通過故障預測算法提前排除潛在故障,提升訓練效率。對于第二個挑戰,華為通過AI DC內網絡與DC間網絡的算法協同,以及業界首個跨上千公里的無損網絡,實現遠距離數據中心協同訓練。
2. AI for Network:構建更智能、更安全、更可靠的網絡
許多垂直行業都在探索如何利用AI,面臨決策實時性、推理嚴謹性和場景泛化性等挑戰。王輝提出,解決這些問題的關鍵在于大模型推理能力與領域機理模型和工具的深度結合,構建一個AI Native的智能網絡系統,即“一網一圖一腦”。
“一網”指智能網元,提供精準數據和控制;“一圖”指網絡數字地圖,構建網絡的數字孿生,提供精準的上下文信息;“一腦”指通信大模型,融合領域知識和強推理能力,實現網絡的“自動駕駛”。 該大模型需要具備類O(1)的強推理能力,并融合領域專有模型和高質量的領域知識治理,才能滿足工業領域的嚴苛要求。
3. 垂直行業AI落地的挑戰與解決方案
演講中指出了垂直行業應用AI和大模型時面臨的三個主要挑戰:決策實時性、推理嚴謹性和場景泛化性。 這需要一個系統性的解決方案,將智能網元、網絡數字地圖和通信大模型相結合,最終實現網絡的L4級“自動駕駛”。
4. 總結
王輝的演講強調了AI與網絡的緊密聯系,并針對Network for AI和AI for Network分別提出了相應的解決方案。 他認為,只有將大模型的強推理能力與領域知識、工具深度結合,才能真正推動AI在垂直行業的落地,并最終實現網絡的智能化升級。
聯系作者
文章來源:量子位
作者微信:
作者簡介:追蹤人工智能新趨勢,關注科技行業新突破