<label id="3dn8r"><mark id="3dn8r"></mark></label>

<span id="3dn8r"></span>

<span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

從零訓(xùn)練的 1B 以下小模型匯總

AIGC動態(tài)10個月前發(fā)布算法邦

350 0 0

從零訓(xùn)練的 1B 以下小模型匯總

AIGC動態(tài)歡迎閱讀

原標(biāo)題：從零訓(xùn)練的 1B 以下小模型匯總
關(guān)鍵字：知乎,解讀,模型,侵權(quán),數(shù)據(jù)
文章來源：算法邦
內(nèi)容字?jǐn)?shù)：0字

內(nèi)容摘要：

導(dǎo)讀本文來自知乎，作者為Angry Bugs。出于學(xué)術(shù)/技術(shù)分享進行轉(zhuǎn)載，如有侵權(quán)，聯(lián)系刪文。
本文是作者自己從頭訓(xùn)練一個1B以下的模型的相關(guān)技巧和資源的匯總。
原文鏈接：https://zhuanlan.zhihu.com/p/693252663最好的學(xué)習(xí)方式莫過于自己從頭做一遍。學(xué)模型的相關(guān)知識以來，一直都想從頭自己訓(xùn)練一個 1B 以下的模型，感覺這樣才算是真的學(xué)過了。不過以手頭的資源，也只能玩玩兒迷你的小模型了。最近在網(wǎng)上搜了不少資料，主要是 GitHub 上的倉庫和 Arxiv 上的 paper，順便記錄在這里。
https://github.com/karpathy/nanoGPT/
nanoGPT 是 karpathy 大神寫的 GPT-2 最小實現(xiàn)。麻雀雖小，五臟俱全。GPT-2 是大模型的鼻祖，很多論文都以 nanoGPT 為基礎(chǔ)魔改或者作為 baseline。nanoGPT 共有 0.1B 到 1.5B 四個大小不同的版本。
訓(xùn)練 GPT-2 的文章有很多，雖然有些比較老的，但是也值得參考，列舉一些我覺得不錯的：
https://www.kaggle.com/co

原文鏈接：從零訓(xùn)練的 1B 以下小模型匯總

聯(lián)系作者

文章來源：算法邦
作者微信：allplusai
作者簡介：智猩猩矩陣賬號之一，聚焦生成式AI，重點關(guān)注模型與應(yīng)用。

# AIGC動態(tài)# 侵權(quán)# 數(shù)據(jù)# 模型 # 知乎 # 解讀

? 版權(quán)聲明

文章版權(quán)歸作者所有，未經(jīng)允許請勿轉(zhuǎn)載。

Trae官網(wǎng)

相關(guān)文章

Trae官網(wǎng)

暫無評論

暫無評論...

打開我，進入AI時代。
全面、高效的AI工具產(chǎn)品情報，發(fā)現(xiàn)和使用最酷的AI工具！
Ctrl + D 或 ? + D 收藏本站到瀏覽器書簽欄。

OpenI AI助手在線工具硅基流動豆包 Trae 扣子Coze 即夢繪蛙

Copyright ? 2025 OpenI 粵ICP備19001258號

粵公網(wǎng)安備 44011502001135號 SiteMap XML

主站蜘蛛池模板：久久国产免费一区二区三区| 日本一道本高清免费| 亚洲综合色区中文字幕| 国产色爽女小说免费看| 中文字幕免费在线观看动作大片| 亚洲精品免费观看| 国产福利免费在线观看| 三年片在线观看免费| 亚洲熟妇自偷自拍另欧美| 亚洲一区二区女搞男| 成年女人色毛片免费看| 两性色午夜视频免费网| 亚洲日韩经典中文字幕| 亚洲精品无码午夜福利中文字幕| 99在线视频免费观看视频| 中文字幕的电影免费网站| 亚洲日韩精品无码专区 | 久久久无码精品亚洲日韩蜜桃 | 国产免费小视频在线观看| 久久精品私人影院免费看| 精品亚洲福利一区二区| 中文字幕亚洲精品资源网| 亚洲国产成人影院播放| 日韩欧毛片免费视频| 两个人看的www高清免费视频| AV激情亚洲男人的天堂国语| 亚洲综合激情视频| 亚洲精品无码久久久久去q| 日韩免费无码一区二区视频 | 亚洲AV永久无码精品水牛影视| 午夜视频免费成人| 亚洲免费福利视频| 91福利免费网站在线观看| 看Aⅴ免费毛片手机播放| 亚洲AV色吊丝无码| 久久久久亚洲Av无码专| 久久被窝电影亚洲爽爽爽| 亚洲成年人啊啊aa在线观看| 免费观看大片毛片| 免费av欧美国产在钱| 在线观看H网址免费入口|