視頻生成領先 OpenAI 了?
原標題:OpenAI被偷家,谷歌Veo 2反超Sora
文章來源:機器之心
內容字數:4389字
谷歌AI強勢反擊:Veo 2視頻生成模型超越OpenAI Sora
近日,谷歌發布了三款重磅AI模型:Veo 2視頻生成模型、Imagen 3文生圖模型和Whisk圖生圖工具,其中Veo 2尤為引人注目,其生成質量被認為超越了當前最佳的視頻生成模型OpenAI Sora,引發了業內廣泛關注。
Veo 2:驚艷的視頻生成能力
Veo 2能夠生成高質量的4K分辨率視頻,時長可超過2分鐘。它不僅能理解文本和圖像提示詞,還能理解相機控制指令(如廣角鏡頭、POV等),并能準確重建真實世界的物理交互和人臉表情。雖然目前在谷歌的實驗性工具VideoFX中,Veo 2僅提供720p分辨率、8秒長視頻的生成服務,但其現有表現已足夠驚艷,甚至獲得了馬斯克的贊揚。
人類評估:Veo 2勝率超高
谷歌進行的人類評估顯示,Veo 2在整體偏好和指令遵從度上均大幅領先Meta Movie Gen、可靈1.5、Minimax和Sora Turbo等模型。其被其他模型勝過的概率不超過33%。而Sora Turbo的表現則令人意外地遜色。
Veo 2的突出優勢:真實感與細節
Veo 2在物理世界的理解力上表現出色,生成的視頻畫面真實度極高,例如水波紋、光影、人物動作等細節都處理得非常到位,幾乎難以分辨是AI生成。它還能生成自然細膩的人類表情,以及復雜的場景(如蜜蜂群飛),避免了以往AI生成視頻中常見的“AI味”和不自然感。DeepMind也指出Veo 2減少了“幻覺”的出現,輸出更加逼真。
強大的功能和未來規劃
Veo 2不僅能生成逼真的現實場景,也能勝任幻想和動畫內容的創作。它還能輕松實現復雜的視覺效果,例如實時追蹤物體并精準置換材質,保證畫面流暢自然。谷歌計劃明年將Veo 2擴展到YouTube Shorts和其他產品上。
與OpenAI的競爭
Veo 2的出現被視為谷歌對OpenAI的強勢反擊。OpenAI近期直播活動干貨不足,而Sora項目負責人又跳槽至DeepMind,這都對OpenAI造成了一定的壓力。Veo 2的領先優勢,使得谷歌在AI視頻生成領域占據了有利地位。
目前Veo 2尚未正式開放,需要用戶填表排隊申請。雖然仍處于測試階段,但Veo 2展現出的強大能力已足以讓人期待其未來的發展和應用。
聯系作者
文章來源:機器之心
作者微信:
作者簡介:專業的人工智能媒體和產業服務平臺