昆侖萬維發布國內首個面向AI短劇的開源視頻大模型。
原標題:最懂表演的視頻大模型開源!AI短劇迎來“DeepSeek時刻”|甲子光年
文章來源:甲子光年
內容字數:10774字
昆侖萬維開源AI短劇大模型:開啟視頻創作新時代
本文總結了昆侖萬維發布的國內首個面向AI短劇創作的開源視頻大模型SkyReels-V1及其配套算法SkyReels-A1 的核心要點。該模型的開源,有望推動AI短劇市場迎來新的發展高峰。
1. “最懂表演”的AI短劇大模型
SkyReels-V1是基于騰訊HunYuan-Video大模型進行微調和優化的垂直領域模型,專注于AI短劇創作。它最大的特點是“最懂表演”,在人物微表情、動作細節、場景、畫面構圖、運鏡等方面表現出色,生成效果媲美專業影視作品。 這得益于昆侖萬維基于千萬級高質量影視數據進行訓練,并自研Human-Centric視頻理解多模態大模型,提升了對人物表演的理解能力。SkyReels-V1支持文生視頻和圖生視頻,生成效果與閉源模型海螺AI、可靈AI不相上下,甚至在細節處理上更勝一籌。
2. 高效易用的自研推理框架SkyReels-Infer
為了解決開源模型推理效率低下的問題,昆侖萬維自研了推理框架SkyReels-Infer。該框架在單卡RTX 4090上生成544P視頻僅需80秒,并支持分布式多卡并行計算和低顯存優化,極大降低了使用門檻和成本,讓更多用戶能夠輕松使用AI視頻生成技術。 與騰訊HunYuan-Video相比,SkyReels-V1在速度和延遲方面均有顯著提升,并支持多種顯卡,滿足不同用戶的需求。
3. SOT表情動作可控算法SkyReels-A1
除了視頻生成模型,昆侖萬維還開源了表情動作可控算法SkyReels-A1。該算法能夠實現電影級別的表情捕捉和“AI換臉”,將人物B的表情、動作、臺詞等移植到人物A上,效果接近甚至超越閉源的Runway Act-One。SkyReels-A1在表情還原、動作捕捉、人臉保持等方面都表現出色,為創作者提供了高效、靈活且低成本的視頻制作方案。
4. 開源精神與AI短劇市場展望
昆侖萬維長期以來堅持開源理念,SkyReels-V1和SkyReels-A1的開源是其在AIGC領域的又一重要舉措。 公司計劃未來繼續開源更多技術,進一步降低AI視頻創作門檻。 AI短劇市場潛力巨大,預計未來將迎來高速增長。昆侖萬維的開源模型,將極大降低AI短劇創作門檻,推動“一人一劇”時代到來,并促進全球文化平權。
總而言之,昆侖萬維開源的SkyReels-V1和SkyReels-A1,為AI短劇創作提供了強大的工具,有望推動AI短劇市場迎來類似DeepSeek R1對文本大模型帶來的影響,開啟視頻創作新時代。
聯系作者
文章來源:甲子光年
作者微信:
作者簡介:甲子光年是一家科技智庫,包含智庫、社群、企業服務版塊,立足中國科技創新前沿陣地,動態跟蹤頭部科技企業發展和傳統產業技術升級案例,推動人工智能、大數據、物聯網、云計算、新能源、新材料、信息安全、大健康等科技創新在產業中的應用與落地。