對話360集團(tuán)梁志輝:360是如何做大模型的?|甲子光年
AIGC動態(tài)歡迎閱讀
原標(biāo)題:對話360集團(tuán)梁志輝:360是如何做大模型的?|甲子光年
文章來源:甲子光年
內(nèi)容字?jǐn)?shù):18998字
內(nèi)容摘要:1個千億的大模型+N個百億小模型的部署方式或許是最優(yōu)路線。作者|蘇霍伊???編輯|趙健???明天,是 ChatGPT 問世一的日子。過去的一年時間已證明,AI 大模型并不是泡沫,作為新一代的生產(chǎn)力工具,它將成為數(shù)字化系統(tǒng)的標(biāo)配,賦能產(chǎn)業(yè)數(shù)字化發(fā)展。大模型的最顯著特征在于其龐大的規(guī)模,參數(shù)規(guī)模通常會達(dá)到百億、千億,甚至萬億級別。為了更高效地運(yùn)行這些大模型,算力集群已經(jīng)升級到“萬卡”級別。但是,當(dāng)有些人在追求更大參數(shù)規(guī)模的同時,另一些人則希望把大模型“做小”。普林斯頓大學(xué)計(jì)算機(jī)科學(xué)系助理教授陳丹琦在 2022 年智源大會上就發(fā)表了“Making large models smaller(讓大模型變小)”主題報告。2023 年 5 月,Google 在 I/O 發(fā)布者大會公布了AI 大計(jì)劃:讓大模型變小、嵌入每一個產(chǎn)品。而在國內(nèi)企業(yè)界,360 集團(tuán)創(chuàng)始人周鴻祎的觀點(diǎn)極具代表性。在 2023 …
原文鏈接:點(diǎn)此閱讀原文:對話360集團(tuán)梁志輝:360是如何做大模型的?|甲子光年
聯(lián)系作者
文章來源:甲子光年
作者微信:jazzyear
作者簡介:甲子光年是一家科技智庫,包含智庫、社群、企業(yè)服務(wù)版塊,立足中國科技創(chuàng)新前沿陣地,動態(tài)跟蹤頭部科技企業(yè)發(fā)展和傳統(tǒng)產(chǎn)業(yè)技術(shù)升級案例,推動人工智能、大數(shù)據(jù)、物聯(lián)網(wǎng)、云計(jì)算、新能源、新材料、信息安全、大健康等科技創(chuàng)新在產(chǎn)業(yè)中的應(yīng)用與落地。