OpenAI被偷家,谷歌Veo 2反超Sora
視頻生成領(lǐng)先 OpenAI 了?
原標(biāo)題:OpenAI被偷家,谷歌Veo 2反超Sora
文章來源:機(jī)器之心
內(nèi)容字?jǐn)?shù):4389字
谷歌AI強(qiáng)勢反擊:Veo 2視頻生成模型超越OpenAI Sora
近日,谷歌發(fā)布了三款重磅AI模型:Veo 2視頻生成模型、Imagen 3文生圖模型和Whisk圖生圖工具,其中Veo 2尤為引人注目,其生成質(zhì)量被認(rèn)為超越了當(dāng)前最佳的視頻生成模型OpenAI Sora,引發(fā)了業(yè)內(nèi)廣泛關(guān)注。
Veo 2:驚艷的視頻生成能力
Veo 2能夠生成高質(zhì)量的4K分辨率視頻,時長可超過2分鐘。它不僅能理解文本和圖像提示詞,還能理解相機(jī)控制指令(如廣角鏡頭、POV等),并能準(zhǔn)確重建真實(shí)世界的物理交互和人臉表情。雖然目前在谷歌的實(shí)驗(yàn)性工具VideoFX中,Veo 2僅提供720p分辨率、8秒長視頻的生成服務(wù),但其現(xiàn)有表現(xiàn)已足夠驚艷,甚至獲得了馬斯克的贊揚(yáng)。
人類評估:Veo 2勝率超高
谷歌進(jìn)行的人類評估顯示,Veo 2在整體偏好和指令遵從度上均大幅領(lǐng)先Meta Movie Gen、可靈1.5、Minimax和Sora Turbo等模型。其被其他模型勝過的概率不超過33%。而Sora Turbo的表現(xiàn)則令人意外地遜色。
Veo 2的突出優(yōu)勢:真實(shí)感與細(xì)節(jié)
Veo 2在物理世界的理解力上表現(xiàn)出色,生成的視頻畫面真實(shí)度極高,例如水波紋、光影、人物動作等細(xì)節(jié)都處理得非常到位,幾乎難以分辨是AI生成。它還能生成自然細(xì)膩的人類表情,以及復(fù)雜的場景(如蜜蜂群飛),避免了以往AI生成視頻中常見的“AI味”和不自然感。DeepMind也指出Veo 2減少了“幻覺”的出現(xiàn),輸出更加逼真。
強(qiáng)大的功能和未來規(guī)劃
Veo 2不僅能生成逼真的現(xiàn)實(shí)場景,也能勝任幻想和動畫內(nèi)容的創(chuàng)作。它還能輕松實(shí)現(xiàn)復(fù)雜的視覺效果,例如實(shí)時追蹤物體并精準(zhǔn)置換材質(zhì),保證畫面流暢自然。谷歌計劃明年將Veo 2擴(kuò)展到Y(jié)ouTube Shorts和其他產(chǎn)品上。
與OpenAI的競爭
Veo 2的出現(xiàn)被視為谷歌對OpenAI的強(qiáng)勢反擊。OpenAI近期直播活動干貨不足,而Sora項(xiàng)目負(fù)責(zé)人又跳槽至DeepMind,這都對OpenAI造成了一定的壓力。Veo 2的領(lǐng)先優(yōu)勢,使得谷歌在AI視頻生成領(lǐng)域占據(jù)了有利地位。
目前Veo 2尚未正式開放,需要用戶填表排隊申請。雖然仍處于測試階段,但Veo 2展現(xiàn)出的強(qiáng)大能力已足以讓人期待其未來的發(fā)展和應(yīng)用。
聯(lián)系作者
文章來源:機(jī)器之心
作者微信:
作者簡介:專業(yè)的人工智能媒體和產(chǎn)業(yè)服務(wù)平臺