AIGC動態歡迎閱讀
原標題:對話360集團梁志輝:360是如何做大模型的?|甲子光年
文章來源:甲子光年
內容字數:18998字
內容摘要:1個千億的大模型+N個百億小模型的部署方式或許是最優路線。作者|蘇霍伊???編輯|趙健???明天,是 ChatGPT 問世一的日子。過去的一年時間已證明,AI 大模型并不是泡沫,作為新一代的生產力工具,它將成為數字化系統的標配,賦能產業數字化發展。大模型的最顯著特征在于其龐大的規模,參數規模通常會達到百億、千億,甚至萬億級別。為了更高效地運行這些大模型,算力集群已經升級到“萬卡”級別。但是,當有些人在追求更大參數規模的同時,另一些人則希望把大模型“做小”。普林斯頓大學計算機科學系助理教授陳丹琦在 2022 年智源大會上就發表了“Making large models smaller(讓大模型變小)”主題報告。2023 年 5 月,Google 在 I/O 發布者大會公布了AI 大計劃:讓大模型變小、嵌入每一個產品。而在國內企業界,360 集團創始人周鴻祎的觀點極具代表性。在 2023 …
原文鏈接:點此閱讀原文:對話360集團梁志輝:360是如何做大模型的?|甲子光年
聯系作者
文章來源:甲子光年
作者微信:jazzyear
作者簡介:甲子光年是一家科技智庫,包含智庫、社群、企業服務版塊,立足中國科技創新前沿陣地,動態跟蹤頭部科技企業發展和傳統產業技術升級案例,推動人工智能、大數據、物聯網、云計算、新能源、新材料、信息安全、大健康等科技創新在產業中的應用與落地。
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...