史上首個100%開源大模型重磅登場!破紀錄公開代碼/權重/數據集/訓練全過程,AMD都能訓
AIGC動態(tài)歡迎閱讀
原標題:史上首個100%開源大模型重磅登場!破紀錄公開代碼/權重/數據集/訓練全過程,AMD都能訓
關鍵字:模型,研究人員,數據,權重,數據源
文章來源:新智元
內容字數:9927字
內容摘要:
新智元報道編輯:潤 好困
【新智元導讀】艾倫人工智能研究所等5機構最近公布了史上最全的開源模型「OLMo」,公開了模型的模型權重、完整訓練代碼、數據集和訓練過程,為以后開源社區(qū)的工作設立了新的標桿。多年來,語言模型一直是自然語言處理(NLP)技術的核心,考慮到模型背后的巨大商業(yè)價值,最大最先進的模型的技術細節(jié)都是不公開的。
現在,真·完全開源的大模型來了!
來自艾倫人工智能研究所、華盛頓大學、耶魯大學、紐約大學和卡內基梅隆大學的研究人員,聯合發(fā)表了一項足以載入AI開源社區(qū)史冊的工作——
他們幾乎將從零開始訓練一個大模型過程中的一切數據和資料都開源了!
論文:https://allenai.org/olmo/olmo-paper.pdf
權重:https://huggingface.co/allenai/OLMo-7B
代碼:https://github.com/allenai/OLMo
數據:https://huggingface.co/datasets/allenai/dolma
評估:https://github.com/allenai/OLMo-Eval
適配:https://
原文鏈接:史上首個100%開源大模型重磅登場!破紀錄公開代碼/權重/數據集/訓練全過程,AMD都能訓
聯系作者
文章來源:新智元
作者微信:AI_era
作者簡介:智能+中國主平臺,致力于推動中國從互聯網+邁向智能+新紀元。重點關注人工智能、機器人等前沿領域發(fā)展,關注人機融合、人工智能和機器人對人類社會與文明進化的影響,領航中國新智能時代。