對話360集團梁志輝：360是如何做大模型的？｜甲子光年

AIGC動態2年前 (2023)發布甲子光年

AIGC動態歡迎閱讀

原標題：對話360集團梁志輝：360是如何做大模型的？｜甲子光年

關鍵字：模型,甲子,報告,能力,問題

文章來源：甲子光年

內容字數：18998字

內容摘要：1個千億的大模型+N個百億小模型的部署方式或許是最優路線。作者｜蘇霍伊???編輯｜趙健???明天，是 ChatGPT 問世一的日子。過去的一年時間已證明，AI 大模型并不是泡沫，作為新一代的生產力工具，它將成為數字化系統的標配，賦能產業數字化發展。大模型的最顯著特征在于其龐大的規模，參數規模通常會達到百億、千億，甚至萬億級別。為了更高效地運行這些大模型，算力集群已經升級到“萬卡”級別。但是，當有些人在追求更大參數規模的同時，另一些人則希望把大模型“做小”。普林斯頓大學計算機科學系助理教授陳丹琦在 2022 年智源大會上就發表了“Making large models smaller（讓大模型變小）”主題報告。2023 年 5 月，Google 在 I/O 發布者大會公布了AI 大計劃：讓大模型變小、嵌入每一個產品。而在國內企業界，360 集團創始人周鴻祎的觀點極具代表性。在 2023 …

原文鏈接：點此閱讀原文：對話360集團梁志輝：360是如何做大模型的？｜甲子光年