<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        從零訓(xùn)練的 1B 以下小模型匯總

        AIGC動態(tài)1年前 (2024)發(fā)布 算法邦
        355 0 0

        從零訓(xùn)練的 1B 以下小模型匯總

        AIGC動態(tài)歡迎閱讀

        原標(biāo)題:從零訓(xùn)練的 1B 以下小模型匯總
        關(guān)鍵字:知乎,解讀,模型,侵權(quán),數(shù)據(jù)
        文章來源:算法邦
        內(nèi)容字?jǐn)?shù):0字

        內(nèi)容摘要:


        導(dǎo)讀本文來自知乎,作者為Angry Bugs。出于學(xué)術(shù)/技術(shù)分享進(jìn)行轉(zhuǎn)載,如有侵權(quán),聯(lián)系刪文。
        本文是作者自己從頭訓(xùn)練一個1B以下的模型的相關(guān)技巧和資源的匯總。
        原文鏈接:https://zhuanlan.zhihu.com/p/693252663最好的學(xué)習(xí)方式莫過于自己從頭做一遍。學(xué)模型的相關(guān)知識以來,一直都想從頭自己訓(xùn)練一個 1B 以下的模型,感覺這樣才算是真的學(xué)過了。不過以手頭的資源,也只能玩玩兒迷你的小模型了。最近在網(wǎng)上搜了不少資料,主要是 GitHub 上的倉庫和 Arxiv 上的 paper,順便記錄在這里。
        https://github.com/karpathy/nanoGPT/
        nanoGPT 是 karpathy 大神寫的 GPT-2 最小實現(xiàn)。麻雀雖小,五臟俱全。GPT-2 是大模型的鼻祖,很多論文都以 nanoGPT 為基礎(chǔ)魔改或者作為 baseline。nanoGPT 共有 0.1B 到 1.5B 四個大小不同的版本。
        訓(xùn)練 GPT-2 的文章有很多,雖然有些比較老的,但是也值得參考,列舉一些我覺得不錯的:
        https://www.kaggle.com/co


        原文鏈接:從零訓(xùn)練的 1B 以下小模型匯總

        聯(lián)系作者

        文章來源:算法邦
        作者微信:allplusai
        作者簡介:智猩猩矩陣賬號之一,聚焦生成式AI,重點關(guān)注模型與應(yīng)用。

        閱讀原文
        ? 版權(quán)聲明
        蟬鏡AI數(shù)字人

        相關(guān)文章

        蟬鏡AI數(shù)字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 久久噜噜噜久久亚洲va久| 亚洲综合激情五月色一区| 日韩毛片在线免费观看| 日本黄色免费观看| 亚洲kkk4444在线观看| 无码视频免费一区二三区| 国产亚洲精品VA片在线播放| 久久久www成人免费毛片| 亚洲AV无码久久久久网站蜜桃| 青青在线久青草免费观看| 亚洲中文无码av永久| AV片在线观看免费| 久久精品国产亚洲av天美18| 国产gav成人免费播放视频| 亚洲国产精品无码专区| 国产亚洲精aa在线看| 成年女人视频网站免费m| 亚洲av无码专区国产不乱码 | 免费一级毛片清高播放| 久久亚洲AV成人出白浆无码国产| 亚洲jizzjizz少妇| 最近中文字幕免费mv在线视频| 亚洲精品人成电影网| 永久免费毛片在线播放| 亚洲欧洲国产日韩精品| 国产免费伦精品一区二区三区| 亚洲夜夜欢A∨一区二区三区 | 九九免费观看全部免费视频| 国产va精品免费观看| 亚洲欧洲无码AV不卡在线| 亚洲阿v天堂在线2017免费| A国产一区二区免费入口| 中文字幕亚洲精品| 十八禁在线观看视频播放免费| 国产网站免费观看| 中文在线日本免费永久18近| 亚洲免费视频一区二区三区| 亚洲w码欧洲s码免费| 免费a级毛片无码a∨性按摩| 久久久久成人片免费观看蜜芽| 亚洲中文字幕无码一久久区|