原標(biāo)題:阿里云通義萬相2.1視頻生成模型推出:登頂VBench榜單,支持中文文字生成
文章來源:小夏聊AIGC
內(nèi)容字數(shù):2135字
阿里云通義萬相2.1:AI視頻生成技術(shù)的新里程碑
近日,阿里云旗下的AI視頻生成模型通義萬相迎來了2.1版本的重大升級,引發(fā)了業(yè)界廣泛關(guān)注。此次升級不僅在技術(shù)性能上取得了顯著突破,更拓展了應(yīng)用場景,為AI視頻生成領(lǐng)域樹立了新的標(biāo)桿。
性能大幅提升,逼真效果驚艷
通義萬相2.1版本推出了極速版和專業(yè)版兩個版本,分別針對不同需求進行優(yōu)化。極速版注重效率,專業(yè)版則追求卓越的表現(xiàn)力。在技術(shù)層面,該版本在處理復(fù)雜、還原真實物理規(guī)律、提升電影質(zhì)感以及優(yōu)化指令遵循等方面取得了重大進展。通過先進的算法和海量數(shù)據(jù)訓(xùn)練,模型能夠生成更加逼真、生動的視頻內(nèi)容,細節(jié)處理精細入微,極大地提升了視覺觀感。
例如,“切牛排”這一經(jīng)典測試場景中,通義萬相2.1生成的畫面展現(xiàn)了清晰的牛排紋理、逼真的刀鋒切入效果以及Q彈的肉質(zhì)質(zhì)感。在人物特寫方面,模型能夠精準(zhǔn)捕捉人物表情、手部和肢體動作,使其自然協(xié)調(diào),符合規(guī)律,展現(xiàn)出令人驚艷的細節(jié)還原能力。
登頂VBench榜單,實力雄厚
通義萬相2.1的強大實力也得到了權(quán)威評測的認可。它在權(quán)威視頻生成評測榜單VBench上以84.7%的總分奪得榜首,超越了Gen3、Pika、CausVid等國內(nèi)外知名模型,充分展現(xiàn)了其在該領(lǐng)域的領(lǐng)先地位。(榜單鏈接:https://huggingface.co/spaces/Vchitect/VBench_Leaderboard)
創(chuàng)新功能,拓展應(yīng)用場景
除了性能提升,通義萬相2.1還帶來了諸多創(chuàng)新功能,極大拓展了應(yīng)用場景。它成為首個支持中文文字生成,并同時支持中英文文字特效生成的AI視頻生成模型,為視頻內(nèi)容創(chuàng)作增添了更多趣味性和互動性。例如,可以輕松生成一個橘黃色的正方體小盒子里跳出英文單詞“Synced”的動畫效果。
此外,通義萬相2.1還支持多種藝術(shù)風(fēng)格的視頻生成,包括卡通、電影色、3D風(fēng)格、油畫、古典等,滿足不同用戶的創(chuàng)作需求。它還支持不同長寬比的視頻輸出,方便用戶在不同終端設(shè)備上播放。
未來展望,引領(lǐng)行業(yè)發(fā)展
通義萬相2.1的升級不僅提升了模型的性能,更開拓了AI視頻生成技術(shù)的應(yīng)用前景。隨著人工智能技術(shù)的不斷發(fā)展,通義萬相有望繼續(xù)引領(lǐng)行業(yè)潮流,為用戶帶來更多精彩的視覺體驗。目前,用戶可以在通義萬相官網(wǎng)體驗最新版本,開發(fā)者也可以在阿里云百煉平臺上調(diào)用大模型API進行開發(fā)和應(yīng)用。
通義萬相2.1的推出標(biāo)志著AI視頻生成技術(shù)邁向了新的階段,我們期待它在未來帶來更多驚喜和突破。
聯(lián)系作者
文章來源:小夏聊AIGC
作者微信:
作者簡介:專注于人工智能生成內(nèi)容的前沿信息與技術(shù)分享。我們提供AI生成藝術(shù)、文本、音樂、視頻等領(lǐng)域的最新動態(tài)與應(yīng)用案例。每日新聞速遞、技術(shù)解讀、行業(yè)分析、專家觀點和創(chuàng)意展示。期待與您一起探索AI的無限潛力。歡迎關(guān)注并分享您的AI作品或?qū)氋F意見。