AIGC動態歡迎閱讀
原標題:Meta版Sora深夜橫空出世,小扎放出16秒高清大片!92頁論文曝光技術細節,Llama 3架構立功
關鍵字:報告,企鵝,視頻,模型,文本
文章來源:人工智能學家
內容字數:0字
內容摘要:
來源:機器學習研究組訂閱
毫無預兆地,Meta版Sora——Movie Gen,就在剛剛搶先上線了!
Meta將其稱為「迄今最先進的媒體基礎模型」。
全新上線的大殺器Movie Gen Video,是一個30B參數的Transformer模型,可以從單個文本提示,生成高質量的高清圖像和視頻,視頻為1080P、16秒、每秒16幀。一同推出的還有Movie Gen Audio。這是一個13B參數的Transformer模型。通過視頻輸入和文本提示,它就可以可控性生成和視頻同步的高保真音頻,時長最長45秒。
最驚人的是,這次Meta一并連論文都發布了。
論文中,詳細介紹了Movie Gen的架構、訓練方法和實驗結果。
論文地址:https://ai.meta.com/static-resource/movie-gen-research-paper/?utm_source=twitter&utm_medium=organic_social&utm_content=thread&utm_campaign=moviegen
從論文可以看出,Movie Gen Video沿用了Transformer
原文鏈接:Meta版Sora深夜橫空出世,小扎放出16秒高清大片!92頁論文曝光技術細節,Llama 3架構立功
聯系作者
文章來源:人工智能學家
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...