從機(jī)到700億參數(shù)大模型,這里有份教程,還有現(xiàn)成可用的腳本
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:從機(jī)到700億參數(shù)大模型,這里有份教程,還有現(xiàn)成可用的腳本
關(guān)鍵字:機(jī)器,問(wèn)題,錯(cuò)誤,主機(jī),集群
文章來(lái)源:機(jī)器之心
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
選自imbue.com
作者:Imbue 團(tuán)隊(duì)
機(jī)器之心編譯
編輯:panda我們知道 LLM 是在大規(guī)模計(jì)算機(jī)集群上使用海量數(shù)據(jù)訓(xùn)練得到的,機(jī)器之心曾介紹過(guò)不少用于輔助和改進(jìn) LLM 訓(xùn)練流程的方法和技術(shù)。而今天,我們要分享的是一篇深入技術(shù)底層的文章,介紹如何將一堆連操作系統(tǒng)也沒(méi)有的「機(jī)」變成用于訓(xùn)練 LLM 的計(jì)算機(jī)集群。
這篇文章來(lái)自于 AI 初創(chuàng)公司 Imbue,該公司致力于通過(guò)理解機(jī)器的思維方式來(lái)實(shí)現(xiàn)通用智能。
當(dāng)然,將一堆連操作系統(tǒng)也沒(méi)有的「機(jī)」變成用于訓(xùn)練 LLM 的計(jì)算機(jī)集群并不是一個(gè)輕松的過(guò)程,充滿了探索和試錯(cuò),但 Imbue 最終成功訓(xùn)練了一個(gè) 700 億參數(shù)的 LLM,并在此過(guò)程中積累了許多有用的經(jīng)驗(yàn)。
本文將深入介紹該團(tuán)隊(duì)構(gòu)建自己的 LLM 訓(xùn)練基礎(chǔ)設(shè)施的全過(guò)程,并會(huì)分享他們?yōu)榉奖惚O(jiān)控、檢查和糾錯(cuò)而編寫的諸多工具和腳本。
如果你有心構(gòu)建自己的 LLM 訓(xùn)練基礎(chǔ)設(shè)施或好奇 LLM 是如何煉成的,那么這篇文章值得你閱讀和收藏。
以下是 Imbue 團(tuán)隊(duì)文章原文。
引言
我們這個(gè)由研究者和工程師組成的小團(tuán)隊(duì)用了幾個(gè)月時(shí)間在自己的基礎(chǔ)設(shè)施上從頭開始訓(xùn)練了一個(gè) 700
原文鏈接:從機(jī)到700億參數(shù)大模型,這里有份教程,還有現(xiàn)成可用的腳本
聯(lián)系作者
文章來(lái)源:機(jī)器之心
作者微信:
作者簡(jiǎn)介: