史上首個(gè)100%開源大模型重磅登場(chǎng)!破紀(jì)錄公開代碼/權(quán)重/數(shù)據(jù)集/訓(xùn)練全過程,AMD都能訓(xùn)
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:史上首個(gè)100%開源大模型重磅登場(chǎng)!破紀(jì)錄公開代碼/權(quán)重/數(shù)據(jù)集/訓(xùn)練全過程,AMD都能訓(xùn)
關(guān)鍵字:模型,研究人員,數(shù)據(jù),權(quán)重,數(shù)據(jù)源
文章來源:新智元
內(nèi)容字?jǐn)?shù):9927字
內(nèi)容摘要:
新智元報(bào)道編輯:潤(rùn) 好困
【新智元導(dǎo)讀】艾倫人工智能研究所等5機(jī)構(gòu)最近公布了史上最全的開源模型「OLMo」,公開了模型的模型權(quán)重、完整訓(xùn)練代碼、數(shù)據(jù)集和訓(xùn)練過程,為以后開源社區(qū)的工作設(shè)立了新的標(biāo)桿。多年來,語(yǔ)言模型一直是自然語(yǔ)言處理(NLP)技術(shù)的核心,考慮到模型背后的巨大商業(yè)價(jià)值,最大最先進(jìn)的模型的技術(shù)細(xì)節(jié)都是不公開的。
現(xiàn)在,真·完全開源的大模型來了!
來自艾倫人工智能研究所、華盛頓大學(xué)、耶魯大學(xué)、紐約大學(xué)和卡內(nèi)基梅隆大學(xué)的研究人員,聯(lián)合發(fā)表了一項(xiàng)足以載入AI開源社區(qū)史冊(cè)的工作——
他們幾乎將從零開始訓(xùn)練一個(gè)大模型過程中的一切數(shù)據(jù)和資料都開源了!
論文:https://allenai.org/olmo/olmo-paper.pdf
權(quán)重:https://huggingface.co/allenai/OLMo-7B
代碼:https://github.com/allenai/OLMo
數(shù)據(jù):https://huggingface.co/datasets/allenai/dolma
評(píng)估:https://github.com/allenai/OLMo-Eval
適配:https://
原文鏈接:史上首個(gè)100%開源大模型重磅登場(chǎng)!破紀(jì)錄公開代碼/權(quán)重/數(shù)據(jù)集/訓(xùn)練全過程,AMD都能訓(xùn)
聯(lián)系作者
文章來源:新智元
作者微信:AI_era
作者簡(jiǎn)介:智能+中國(guó)主平臺(tái),致力于推動(dòng)中國(guó)從互聯(lián)網(wǎng)+邁向智能+新紀(jì)元。重點(diǎn)關(guān)注人工智能、機(jī)器人等前沿領(lǐng)域發(fā)展,關(guān)注人機(jī)融合、人工智能和機(jī)器人對(duì)人類社會(huì)與文明進(jìn)化的影響,領(lǐng)航中國(guó)新智能時(shí)代。