最懂表演的視頻大模型開源！AI短劇迎來“DeepSeek時刻”｜甲子光年

昆侖萬維發布國內首個面向AI短劇的開源視頻大模型。

原標題：最懂表演的視頻大模型開源！AI短劇迎來“DeepSeek時刻”｜甲子光年
文章來源：甲子光年
內容字數：10774字

昆侖萬維開源AI短劇大模型：開啟視頻創作新時代

本文總結了昆侖萬維發布的國內首個面向AI短劇創作的開源視頻大模型SkyReels-V1及其配套算法SkyReels-A1 的核心要點。該模型的開源，有望推動AI短劇市場迎來新的發展高峰。

1. “最懂表演”的AI短劇大模型

SkyReels-V1是基于騰訊HunYuan-Video大模型進行微調和優化的垂直領域模型，專注于AI短劇創作。它最大的特點是“最懂表演”，在人物微表情、動作細節、場景、畫面構圖、運鏡等方面表現出色，生成效果媲美專業影視作品。這得益于昆侖萬維基于千萬級高質量影視數據進行訓練，并自研Human-Centric視頻理解多模態大模型，提升了對人物表演的理解能力。SkyReels-V1支持文生視頻和圖生視頻，生成效果與閉源模型海螺AI、可靈AI不相上下，甚至在細節處理上更勝一籌。

2. 高效易用的自研推理框架SkyReels-Infer

為了解決開源模型推理效率低下的問題，昆侖萬維自研了推理框架SkyReels-Infer。該框架在單卡RTX 4090上生成544P視頻僅需80秒，并支持分布式多卡并行計算和低顯存優化，極大降低了使用門檻和成本，讓更多用戶能夠輕松使用AI視頻生成技術。與騰訊HunYuan-Video相比，SkyReels-V1在速度和延遲方面均有顯著提升，并支持多種顯卡，滿足不同用戶的需求。

3. SOT表情動作可控算法SkyReels-A1

除了視頻生成模型，昆侖萬維還開源了表情動作可控算法SkyReels-A1。該算法能夠實現電影級別的表情捕捉和“AI換臉”，將人物B的表情、動作、臺詞等移植到人物A上，效果接近甚至超越閉源的Runway Act-One。SkyReels-A1在表情還原、動作捕捉、人臉保持等方面都表現出色，為創作者提供了高效、靈活且低成本的視頻制作方案。

4. 開源精神與AI短劇市場展望

昆侖萬維長期以來堅持開源理念，SkyReels-V1和SkyReels-A1的開源是其在AIGC領域的又一重要舉措。公司計劃未來繼續開源更多技術，進一步降低AI視頻創作門檻。 AI短劇市場潛力巨大，預計未來將迎來高速增長。昆侖萬維的開源模型，將極大降低AI短劇創作門檻，推動“一人一劇”時代到來，并促進全球文化平權。

總而言之，昆侖萬維開源的SkyReels-V1和SkyReels-A1，為AI短劇創作提供了強大的工具，有望推動AI短劇市場迎來類似DeepSeek R1對文本大模型帶來的影響，開啟視頻創作新時代。