潞晨科技尤洋:如何用低成本做出類Sora?成功復現(xiàn)有四個要素,時空分割是關鍵一步|GenAICon2024

AIGC動態(tài)歡迎閱讀
原標題:潞晨科技尤洋:如何用低成本做出類Sora?成功復現(xiàn)有四個要素,時空分割是關鍵一步|GenAICon2024
關鍵字:模型,視頻,報告,解讀,技術
文章來源:智東西
內(nèi)容字數(shù):14799字
內(nèi)容摘要:
視頻生成正處于“GPT-2時刻”,模型開源是有意義且重要的。
2024中國生成式AI大會于4月18-19日在北京舉行,在大會第二天的主會場AI Infra專場上,新加坡國立大學校長青年教授、潞晨科技創(chuàng)始人兼董事長尤洋以《技術共享:類Sora開源架構模型與訓練細節(jié)》為題發(fā)表演講。
潞晨科技在今年3月開源的全球首個類Sora視頻生成模型Open-Sora,是迄今GitHub上獲得星標數(shù)最高的開源視頻大模型項目之一,截至發(fā)稿前已有1.6萬個星標,用戶群體遍及全球。
值得一提的是,這個模型在低成本下訓練而成。相比Sora耗費數(shù)千張H100 GPU、花費數(shù)千萬美元乃至數(shù)億美元,Open-Sora的訓練成本僅不到1萬美元。
尤洋認為,視頻生成正處于“GPT-2時刻”,還沒有出現(xiàn)成熟的應用。對于視頻生成模型來說,數(shù)據(jù)可能是最核心的資產(chǎn)。他還談到,模型開源是有意義且重要的。正如Meta最新發(fā)布的Llama 3,極大地調(diào)動了開源社區(qū)的積極性,不但造福大量開發(fā)者,更有助于開源社區(qū)整體的繁榮。
因此,Open-Sora模型也進行了全面的訓練流程開源,開源了包括模型架構、模型權重、訓練細節(jié)、數(shù)據(jù)處理在內(nèi)的多項
原文鏈接:潞晨科技尤洋:如何用低成本做出類Sora?成功復現(xiàn)有四個要素,時空分割是關鍵一步|GenAICon2024
聯(lián)系作者
文章來源:智東西
作者微信:zhidxcom
作者簡介:智能產(chǎn)業(yè)新媒體!智東西專注報道人工智能主導的前沿技術發(fā)展,和技術應用帶來的千行百業(yè)產(chǎn)業(yè)升級。聚焦智能變革,服務產(chǎn)業(yè)升級。

粵公網(wǎng)安備 44011502001135號