訓(xùn)練成本不到其 6% 的「聯(lián)邦大模型」,憑什么在會(huì)議場(chǎng)景媲美 GPT-4?
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:訓(xùn)練成本不到其 6% 的「聯(lián)邦大模型」,憑什么在會(huì)議場(chǎng)景媲美 GPT-4?
關(guān)鍵字:模型,聯(lián)邦,成本,性能,場(chǎng)景
文章來(lái)源:AI科技評(píng)論
內(nèi)容字?jǐn)?shù):6731字
內(nèi)容摘要:「三個(gè)臭皮匠,頂個(gè)諸葛亮」。作者丨何思思編輯丨陳彩嫻今年 8 月,在雷峰網(wǎng)于新加坡舉辦的 GAIR 大會(huì)主論壇上,前微軟全球技術(shù)院士、美國(guó)雙院院士黃學(xué)東用一句中國(guó)古語(yǔ)提出了他對(duì)大模型的發(fā)展理論預(yù)測(cè):「三個(gè)臭皮匠,頂個(gè)諸葛亮」。當(dāng)時(shí),國(guó)內(nèi)大模型研發(fā)的主流趨勢(shì)是一家自研一個(gè)基座大模型,正進(jìn)入如火如荼的「百模大戰(zhàn)」中,而黃學(xué)東院士的觀點(diǎn)則反其道而行之,認(rèn)為將所有雞蛋放在一個(gè)籃子里太危險(xiǎn),應(yīng)該將四五家大模型的能力進(jìn)行整合,每個(gè)大模型都有各自的應(yīng)用場(chǎng)景。用一個(gè)專(zhuān)業(yè)詞匯來(lái)概括,離開(kāi)微軟、加入 Zoom 擔(dān)任 CTO 后,黃學(xué)東在 Zoom 內(nèi)部推崇的大模型研發(fā)路線是「聯(lián)邦大模型」——將 OpenAI、Anthropic AI、谷歌、Meta 等等科技巨頭的大語(yǔ)言模型集合在一起,形成 Zoom 的 AI 底座,由此以更低的成本、實(shí)現(xiàn)更好的效果。近日,黃學(xué)東團(tuán)隊(duì)經(jīng)過(guò)一系列的研究與實(shí)驗(yàn),驗(yàn)證了 8 月對(duì)「聯(lián)…
原文鏈接:點(diǎn)此閱讀原文:訓(xùn)練成本不到其 6% 的「聯(lián)邦大模型」,憑什么在會(huì)議場(chǎng)景媲美 GPT-4?
聯(lián)系作者
文章來(lái)源:AI科技評(píng)論
作者微信:aitechtalk
作者簡(jiǎn)介:雷峰網(wǎng)旗下AI新媒體。聚焦AI前沿研究,關(guān)注AI工程落地。