訓(xùn)練成本不到其 6% 的「聯(lián)邦大模型」，憑什么在會議場景媲美 GPT-4？

AIGC動態(tài)2年前 (2023)發(fā)布 AI科技評論

AIGC動態(tài)歡迎閱讀

原標題：訓(xùn)練成本不到其 6% 的「聯(lián)邦大模型」，憑什么在會議場景媲美 GPT-4？

關(guān)鍵字：模型,聯(lián)邦,成本,性能,場景

文章來源：AI科技評論

內(nèi)容字數(shù)：6731字

內(nèi)容摘要：「三個臭皮匠，頂個諸葛亮」。作者丨何思思編輯丨陳彩嫻今年 8 月，在雷峰網(wǎng)于新加坡舉辦的 GAIR 大會主論壇上，前微軟全球技術(shù)院士、美國雙院院士黃學(xué)東用一句中國古語提出了他對大模型的發(fā)展理論預(yù)測：「三個臭皮匠，頂個諸葛亮」。當時，國內(nèi)大模型研發(fā)的主流趨勢是一家自研一個基座大模型，正進入如火如荼的「百模大戰(zhàn)」中，而黃學(xué)東院士的觀點則反其道而行之，認為將所有雞蛋放在一個籃子里太危險，應(yīng)該將四五家大模型的能力進行整合，每個大模型都有各自的應(yīng)用場景。用一個專業(yè)詞匯來概括，離開微軟、加入 Zoom 擔任 CTO 后，黃學(xué)東在 Zoom 內(nèi)部推崇的大模型研發(fā)路線是「聯(lián)邦大模型」——將 OpenAI、Anthropic AI、谷歌、Meta 等等科技巨頭的大語言模型集合在一起，形成 Zoom 的 AI 底座，由此以更低的成本、實現(xiàn)更好的效果。近日，黃學(xué)東團隊經(jīng)過一系列的研究與實驗，驗證了 8 月對「聯(lián)…

原文鏈接：點此閱讀原文：訓(xùn)練成本不到其 6% 的「聯(lián)邦大模型」，憑什么在會議場景媲美 GPT-4？