從零開始,用英偉達T4、A10訓練小型文生視頻模型,幾小時搞定
AIGC動態(tài)歡迎閱讀
原標題:從零開始,用英偉達T4、A10訓練小型文生視頻模型,幾小時搞定
關(guān)鍵字:數(shù)據(jù),模型,圖像,視頻,生成器
文章來源:機器之心
內(nèi)容字數(shù):0字
內(nèi)容摘要:
選自 levelup.gitconnected
作者:Fareed Khan
機器之心編譯
編輯:杜偉、大盤雞很翔實的一篇教程。OpenAI 的 Sora、Stability AI 的 Stable Video Diffusion 以及許多其他已經(jīng)發(fā)布或未來將出現(xiàn)的文本生成視頻模型,是繼大語言模型 (LLM) 之后 2024 年最流行的 AI 趨勢之一。
在這篇博客中,作者將展示如何將從頭開始構(gòu)建一個小規(guī)模的文本生成視頻模型,涵蓋了從理解理論概念、到編寫整個架構(gòu)再到生成最終結(jié)果的所有內(nèi)容。
由于作者沒有大算力的 GPU,所以僅編寫了小規(guī)模架構(gòu)。以下是在不同處理器上訓練模型所需時間的比較。作者表示,在 CPU 上運行顯然需要更長的時間來訓練模型。如果你需要快速測試代碼中的更改并查看結(jié)果,CPU 不是最佳選擇。因此建議使用 Colab 或 Kaggle 的 T4 GPU 進行更高效、更快速的訓練。
構(gòu)建目標
我們采用了與傳統(tǒng)機器學習或深度學習模型類似的方法,即在數(shù)據(jù)集上進行訓練,然后在未見過數(shù)據(jù)上進行測試。在文本轉(zhuǎn)視頻的背景下,假設(shè)有一個包含 10 萬個狗撿球和貓追老鼠視頻的訓練數(shù)據(jù)集,然
原文鏈接:從零開始,用英偉達T4、A10訓練小型文生視頻模型,幾小時搞定
聯(lián)系作者
文章來源:機器之心
作者微信:almosthuman2014
作者簡介:專業(yè)的人工智能媒體和產(chǎn)業(yè)服務(wù)平臺