訓(xùn)練成本不到其 6% 的「聯(lián)邦大模型」,憑什么在會議場景媲美 GPT-4?

AIGC動態(tài)歡迎閱讀
原標題:訓(xùn)練成本不到其 6% 的「聯(lián)邦大模型」,憑什么在會議場景媲美 GPT-4?
關(guān)鍵字:模型,聯(lián)邦,成本,性能,場景
文章來源:AI科技評論
內(nèi)容字數(shù):6731字
內(nèi)容摘要:「三個臭皮匠,頂個諸葛亮」。作者丨何思思編輯丨陳彩嫻今年 8 月,在雷峰網(wǎng)于新加坡舉辦的 GAIR 大會主論壇上,前微軟全球技術(shù)院士、美國雙院院士黃學(xué)東用一句中國古語提出了他對大模型的發(fā)展理論預(yù)測:「三個臭皮匠,頂個諸葛亮」。當時,國內(nèi)大模型研發(fā)的主流趨勢是一家自研一個基座大模型,正進入如火如荼的「百模大戰(zhàn)」中,而黃學(xué)東院士的觀點則反其道而行之,認為將所有雞蛋放在一個籃子里太危險,應(yīng)該將四五家大模型的能力進行整合,每個大模型都有各自的應(yīng)用場景。用一個專業(yè)詞匯來概括,離開微軟、加入 Zoom 擔任 CTO 后,黃學(xué)東在 Zoom 內(nèi)部推崇的大模型研發(fā)路線是「聯(lián)邦大模型」——將 OpenAI、Anthropic AI、谷歌、Meta 等等科技巨頭的大語言模型集合在一起,形成 Zoom 的 AI 底座,由此以更低的成本、實現(xiàn)更好的效果。近日,黃學(xué)東團隊經(jīng)過一系列的研究與實驗,驗證了 8 月對「聯(lián)…
原文鏈接:點此閱讀原文:訓(xùn)練成本不到其 6% 的「聯(lián)邦大模型」,憑什么在會議場景媲美 GPT-4?
聯(lián)系作者
文章來源:AI科技評論
作者微信:aitechtalk
作者簡介:雷峰網(wǎng)旗下AI新媒體。聚焦AI前沿研究,關(guān)注AI工程落地。

粵公網(wǎng)安備 44011502001135號