AIGC動態歡迎閱讀
原標題:AI輔助內部研發效率提升,昇騰大模型推理的最佳實踐
關鍵字:華為,模型,硬件,算子,字節跳動
文章來源:AI前線
內容字數:0字
內容摘要:
演講嘉賓 | 王建輝
以大模型為代表的 AI 技術高速發展,目前 Scaling Law 依然生效,模型參數持續增大,序列不斷增長,響應速度越來越快,但大模型商業閉環依賴推理的規模落地,如何在不斷提升用戶體驗的基礎上不斷降低推理成本,以滿足大模型規模落地的訴求,成為大模型推理技術研究的核心關鍵。為了滿足大模型推理規模落地對客戶體驗和成本的訴求,昇騰推出高性能大模型推理軟硬件解決方案,滿足客戶多樣性開發訴求,助力大模型規模落地。
本文整理自華為昇騰計算首席架構師王建輝在 AICon 2024 北京的演講《昇騰大模型推理最佳實踐》,內容經 InfoQ 進行不改變原意的編輯。
華為昇騰計算首席架構師趙英俊將在 6 月 14-15 日即將舉辦的 ArchSummit 深圳上進一步分享《超大規模 AI 算力集群優化與實踐》。此外,阿里巴巴研究員 / 阿里云云原生應用平臺負責人丁宇(叔同)將帶來《AI 編程如何顛覆生產力》 的 Keynote 主題演講,在《低代碼與 AI 結合》專題上,來自騰訊、網易、螞蟻集團等企業等技術專家也將深入探討在低代碼環境中集成智能決策、自動化流程,以及構建靈活、高效的
原文鏈接:AI輔助內部研發效率提升,昇騰大模型推理的最佳實踐
聯系作者
文章來源:AI前線
作者微信:ai-front
作者簡介:面向AI愛好者、開發者和科學家,提供大模型最新資訊、AI技術分享干貨、一線業界實踐案例,助你全面擁抱AIGC。
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...