原標題:阿里云通義萬相2.1視頻生成模型推出:登頂VBench榜單,支持中文文字生成
文章來源:小夏聊AIGC
內容字數:2135字
阿里云通義萬相2.1:AI視頻生成技術的新里程碑
近日,阿里云旗下的AI視頻生成模型通義萬相迎來了2.1版本的重大升級,引發了業界廣泛關注。此次升級不僅在技術性能上取得了顯著突破,更拓展了應用場景,為AI視頻生成領域樹立了新的標桿。
性能大幅提升,逼真效果驚艷
通義萬相2.1版本推出了極速版和專業版兩個版本,分別針對不同需求進行優化。極速版注重效率,專業版則追求卓越的表現力。在技術層面,該版本在處理復雜、還原真實物理規律、提升電影質感以及優化指令遵循等方面取得了重大進展。通過先進的算法和海量數據訓練,模型能夠生成更加逼真、生動的視頻內容,細節處理精細入微,極大地提升了視覺觀感。
例如,“切牛排”這一經典測試場景中,通義萬相2.1生成的畫面展現了清晰的牛排紋理、逼真的刀鋒切入效果以及Q彈的肉質質感。在人物特寫方面,模型能夠精準捕捉人物表情、手部和肢體動作,使其自然協調,符合規律,展現出令人驚艷的細節還原能力。
登頂VBench榜單,實力雄厚
通義萬相2.1的強大實力也得到了權威評測的認可。它在權威視頻生成評測榜單VBench上以84.7%的總分奪得榜首,超越了Gen3、Pika、CausVid等國內外知名模型,充分展現了其在該領域的領先地位。(榜單鏈接:https://huggingface.co/spaces/Vchitect/VBench_Leaderboard)
創新功能,拓展應用場景
除了性能提升,通義萬相2.1還帶來了諸多創新功能,極大拓展了應用場景。它成為首個支持中文文字生成,并同時支持中英文文字特效生成的AI視頻生成模型,為視頻內容創作增添了更多趣味性和互動性。例如,可以輕松生成一個橘黃色的正方體小盒子里跳出英文單詞“Synced”的動畫效果。
此外,通義萬相2.1還支持多種藝術風格的視頻生成,包括卡通、電影色、3D風格、油畫、古典等,滿足不同用戶的創作需求。它還支持不同長寬比的視頻輸出,方便用戶在不同終端設備上播放。
未來展望,引領行業發展
通義萬相2.1的升級不僅提升了模型的性能,更開拓了AI視頻生成技術的應用前景。隨著人工智能技術的不斷發展,通義萬相有望繼續引領行業潮流,為用戶帶來更多精彩的視覺體驗。目前,用戶可以在通義萬相官網體驗最新版本,開發者也可以在阿里云百煉平臺上調用大模型API進行開發和應用。
通義萬相2.1的推出標志著AI視頻生成技術邁向了新的階段,我們期待它在未來帶來更多驚喜和突破。
聯系作者
文章來源:小夏聊AIGC
作者微信:
作者簡介:專注于人工智能生成內容的前沿信息與技術分享。我們提供AI生成藝術、文本、音樂、視頻等領域的最新動態與應用案例。每日新聞速遞、技術解讀、行業分析、專家觀點和創意展示。期待與您一起探索AI的無限潛力。歡迎關注并分享您的AI作品或寶貴意見。