<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        OpenAI創始大神手搓千行C代碼訓練GPT,附PyTorch遷移教程

        AIGC動態1年前 (2024)發布 量子位
        385 0 0

        OpenAI創始大神手搓千行C代碼訓練GPT,附PyTorch遷移教程

        AIGC動態歡迎閱讀

        原標題:OpenAI創始大神手搓千行C代碼訓練GPT,附PyTorch遷移教程
        關鍵字:項目,模型,表示,嘉賓,峰會
        文章來源:量子位
        內容字數:4674字

        內容摘要:


        明敏 發自 凹非寺量子位 | 公眾號 QbitiAI大神卡帕西(Andrej Karpathy)剛“復工”,立馬帶來神作:
        純C語言訓練GPT,1000行代碼搞定!,不用現成的深度學習框架,純手搓。
        發布僅幾個小時,已經攬星2.3k。
        它可以立即編譯和運行,和PyTorch完全兼容。
        卡帕西使用的示例是GPT-2,但Llama 2和Gemma等也適用。
        項目發布后,他還給出了從PyTorch遷移到C的教程。
        網友們直呼:他甚至都不用C++……
        而且就連怎么讓大模型如法炮制的提示詞,他也放了出來。現在已經有人在用Devin嘗試ing。
        手動實現每個層前向/反向傳播選擇用GPT-2的原因很簡單,有模型權重,采用了堆棧式的Transformer模型結構。
        項目核心的重點包括:
        直接在C/CUDA上訓練LLM,速度接近PyTorch
        通過在CPU版本中使用SIMD指令(如AVX2和NEON)聊加速CPU版本
        支持更先進的架構,比如Llama2和Gemma
        卡帕西解釋,他在開始時分配了所有所需內存,訓練期間內存占用保持不變,只是數據在不同批次之間動態流動。
        關鍵在于手動實現每個單獨層的前向傳播和


        原文鏈接:OpenAI創始大神手搓千行C代碼訓練GPT,附PyTorch遷移教程

        聯系作者

        文章來源:量子位
        作者微信:QbitAI
        作者簡介:追蹤人工智能新趨勢,關注科技行業新突破

        閱讀原文
        ? 版權聲明
        Trae官網

        相關文章

        Trae官網

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 亚洲理论片在线中文字幕| 热99re久久精品精品免费| 免费无码午夜福利片| 亚洲色大成网站WWW国产| 亚洲最大中文字幕| 久久久久亚洲精品天堂| 国产亚洲AV无码AV男人的天堂| 亚洲高清偷拍一区二区三区| 亚洲高清免费视频| 亚洲av午夜福利精品一区| 亚洲精品高清无码视频| 亚洲黄网站wwwwww| 亚洲男女一区二区三区| 亚洲av最新在线观看网址| 亚洲成av人无码亚洲成av人| 九九久久国产精品免费热6| 成人a毛片免费视频观看| 又粗又长又爽又长黄免费视频| 精品国产污污免费网站| 日韩免费无码视频一区二区三区 | 亚洲日本VA中文字幕久久道具| 亚洲一级在线观看| 波多野结衣亚洲一级| 亚洲中文字幕一区精品自拍| 一区二区三区免费电影| 亚洲免费闲人蜜桃| 成年午夜视频免费观看视频| 午夜dj免费在线观看| 亚洲精品乱码久久久久久| 亚洲一日韩欧美中文字幕在线| 九九全国免费视频| 成人黄色免费网址| 精品国产免费观看一区| 亚洲AV无码不卡在线播放| 亚洲免费综合色在线视频| 永久免费av无码网站yy| aa级一级天堂片免费观看| 精品国产免费观看一区| 亚洲AV福利天堂一区二区三| 亚洲精品国产肉丝袜久久| xxxxx做受大片在线观看免费|