全方位、無(wú)死角的開(kāi)源,邢波團(tuán)隊(duì)LLM360讓大模型實(shí)現(xiàn)真正的透明
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:全方位、無(wú)死角的開(kāi)源,邢波團(tuán)隊(duì)LLM360讓大模型實(shí)現(xiàn)真正的透明
關(guān)鍵字:模型,數(shù)據(jù),研究者,檢查點(diǎn),報(bào)告
文章來(lái)源:機(jī)器之心
內(nèi)容字?jǐn)?shù):8024字
內(nèi)容摘要:機(jī)器之心報(bào)道編輯:大盤(pán)雞、佳琪我們需要更全面和深入地共享。開(kāi)源模型正展現(xiàn)著它們蓬勃的生命力,不僅數(shù)量激增,性能更是愈發(fā)優(yōu)秀。圖靈獎(jiǎng)獲得者 Yann LeCun 也發(fā)出了這樣的感嘆:專(zhuān)有模型在技術(shù)性能和創(chuàng)新能力上展現(xiàn)了非凡的力量,但是它們不開(kāi)源的性質(zhì)成為 LLM 發(fā)展的阻礙。一些開(kāi)源模型雖然為從業(yè)者和研究者提供了多樣化的選擇,但大多數(shù)只公開(kāi)了最終的模型權(quán)重或推理代碼,越來(lái)越多的技術(shù)報(bào)告將其范圍限制在頂層設(shè)計(jì)和表面統(tǒng)計(jì)之內(nèi)。這種閉源的策略不僅限制了開(kāi)源模型的發(fā)展,而且還在很大程度上阻礙了整個(gè) LLM 研究領(lǐng)域的進(jìn)步。這意味著,這些模型需要更全面和深入地共享,包括訓(xùn)練數(shù)據(jù)、算法細(xì)節(jié)、實(shí)現(xiàn)挑戰(zhàn)以及性能評(píng)估的細(xì)節(jié)。Cerebras、Petuum 和 MBZUAI 等的研究者們共同提出了 LLM360。這是一項(xiàng)全面開(kāi)源 LLM 的倡議,主張向社區(qū)提供與 LLM 訓(xùn)練相關(guān)的一切,包含訓(xùn)練代碼和數(shù)據(jù)、模型…
原文鏈接:點(diǎn)此閱讀原文:全方位、無(wú)死角的開(kāi)源,邢波團(tuán)隊(duì)LLM360讓大模型實(shí)現(xiàn)真正的透明
聯(lián)系作者
文章來(lái)源:機(jī)器之心
作者微信:almosthuman2014
作者簡(jiǎn)介:專(zhuān)業(yè)的人工智能媒體和產(chǎn)業(yè)服務(wù)平臺(tái)