Karpathy 4小時AI大課上線,小白看了都會從零構建GPT-2!
AIGC動態(tài)歡迎閱讀
原標題:Karpathy 4小時AI大課上線,小白看了都會從零構建GPT-2!
關鍵字:模型,參數(shù),大課,小時,視頻
文章來源:新智元
內(nèi)容字數(shù):0字
內(nèi)容摘要:
新智元報道編輯:桃子
【新智元導讀】距上次Karpathy AI大課更新之后,又有了1個多月的時間。這次他帶了超詳細的4小時課程——從零開始實現(xiàn)1.24億參數(shù)規(guī)模的GPT-2模型。大神Karpathy新一期AI大課又上線了。
這一次,他講的內(nèi)容是——從頭開始實現(xiàn)124M大小的GPT-2模型,足足有4個小時。
Karpathy對這個視頻2個字總結:全面。
我們從空文件開始,以GPT-2(124M)模型結束。
也就是說,這就是手把手教程,就連AI小白看后,都會搭建GPT-2了。
Karpathy稱這是從0到英雄(Zero To Hero)的系列中最新的視頻。
翻看以往Zero To Hero系列中的視頻,最長的也不過2小時25分,這次4小時完全創(chuàng)下了最新記錄。
帖子中,他highlight了最新視頻中的一些重點內(nèi)容:
– 我們首先構建GPT-2神經(jīng)網(wǎng)絡
– 然后對其進行優(yōu)化,以實現(xiàn)快速訓練
– 參考GPT-2和GPT-3論文,設置訓練運行優(yōu)化和超參數(shù)
– 啟動模型評估
– 祈禱一切順利,上床睡覺
– 等到第二天早上,便可查看模型的結果,欣賞模型生成的有趣輸出。
發(fā)布短短的幾個小時,視頻已
原文鏈接:Karpathy 4小時AI大課上線,小白看了都會從零構建GPT-2!
聯(lián)系作者
文章來源:新智元
作者微信:AI_era
作者簡介:智能+中國主平臺,致力于推動中國從互聯(lián)網(wǎng)+邁向智能+新紀元。重點關注人工智能、機器人等前沿領域發(fā)展,關注人機融合、人工智能和機器人對人類社會與文明進化的影響,領航中國新智能時代。