Open-Sora 全面開源升級(jí):支持單鏡頭16s視頻生成和720p分辨率

AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:Open-Sora 全面開源升級(jí):支持單鏡頭16s視頻生成和720p分辨率
關(guān)鍵字:報(bào)告,視頻,解讀,分辨率,作者
文章來源:夕小瑤科技說
內(nèi)容字?jǐn)?shù):7341字
內(nèi)容摘要:
Open-Sora 在開源社區(qū)悄悄更新了,現(xiàn)在支持單鏡頭長(zhǎng)達(dá)16秒的視頻生成,分辨率最高可達(dá)720p,并且可以處理任何寬高比的文本到圖像、文本到視頻、圖像到視頻、視頻到視頻和無限長(zhǎng)視頻的生成需求。我們來試試效果。
生成個(gè)橫屏圣誕雪景,發(fā)b站
再生成個(gè)豎屏,發(fā)抖音
還能生成單鏡頭16秒的長(zhǎng)視頻,這下人人都能過把編劇癮了
怎么玩?指路GitHub:https://github.com/hpcaitech/Open-Sora
更酷的是,Open-Sora 依舊全部開源,包含最新的模型架構(gòu)、最新的模型權(quán)重、多時(shí)間/分辨率/長(zhǎng)寬比/幀率的訓(xùn)練流程、數(shù)據(jù)收集和預(yù)處理的完整流程、所有的訓(xùn)練細(xì)節(jié)、demo示例 和 詳盡的上手教程。
Open-Sora 技術(shù)報(bào)告全面解讀最新功能概覽作者團(tuán)隊(duì)在GitHub上正式發(fā)布了Open-Sora 技術(shù)報(bào)告[1],根據(jù)筆者的了解,本次更新主要包括以下幾項(xiàng)關(guān)鍵特性:
支持長(zhǎng)視頻生成;
視頻生成分辨率最高可達(dá)720p;
單模型支持任何寬高比,不同分辨率和時(shí)長(zhǎng)的文本到圖像、文本到視頻、圖像到視頻、視頻到視頻和無限長(zhǎng)視頻的生成需求;
提出了更穩(wěn)定的模型架構(gòu)設(shè)計(jì),支持多時(shí)間/分
原文鏈接:Open-Sora 全面開源升級(jí):支持單鏡頭16s視頻生成和720p分辨率
聯(lián)系作者
文章來源:夕小瑤科技說
作者微信:xixiaoyaoQAQ
作者簡(jiǎn)介:專業(yè)、有趣、深度價(jià)值導(dǎo)向的科技媒體。聚集30萬AI工程師、研究員,覆蓋500多家海內(nèi)外機(jī)構(gòu)投資人,互聯(lián)網(wǎng)大廠中高管和AI公司創(chuàng)始人。一線作者來自清北、國(guó)內(nèi)外頂級(jí)AI實(shí)驗(yàn)室和大廠,兼?zhèn)涿翡J的行業(yè)嗅覺和洞察深度。商務(wù)合作:zym5189

粵公網(wǎng)安備 44011502001135號(hào)