錘爆Sora，尺度最大，谷歌發布最強視頻模型Veo2，叫板海螺可靈

原標題：錘爆Sora，尺度最大，谷歌發布最強視頻模型Veo2，叫板海螺可靈
文章來源：夕小瑤科技說
內容字數：10917字

谷歌AI反擊戰：Veo 2和Imagen 3強勢來襲，OpenAI的Sora黯然失色

近期，谷歌DeepMind強勢發布了兩個重量級AI模型，直接挑戰OpenAI的領先地位。其中，視頻生成模型Veo 2以其卓越的性能，引發業界廣泛關注，而文生圖模型Imagen 3也展現出令人驚艷的細節和光照效果。此舉被視為谷歌對OpenAI近期一系列產品發布的強力反擊。

Veo 2：年度最佳視頻生成模型？
Veo 2在視頻生成時長、分辨率和質量上全面超越OpenAI的Sora。Sora 20美元版本僅能生成5秒720p視頻，而200美元版本也只有20秒1080p。相比之下，Veo 2可生成約2分鐘4K高清視頻。在第三方評測中，Veo 2在整體滿意度和指令遵循度上均優于Sora、Meta Movie Gen、Kling v1.5和Minimax等模型。Veo 2的顯著改進體現在保真度（細節真實，減少偽影）、準確度（理解物理世界，精準遵循指令）和相機控制（掌握電影攝影技巧，可創建各種拍攝風格）等方面。眾多官方演示視頻展示了Veo 2在模擬真實場景（如切西紅柿、早餐場景、動物游泳等）和虛構場景（如夢境般的光影效果）方面的出色表現，其生成的視頻質量已達到以假亂真的程度。
Imagen 3：細節更勝一籌的文生圖模型
除了Veo 2，谷歌還同步發布了Imagen 3文生圖模型。該模型在圖像細節、光照效果和減少干擾方面均有顯著提升，其benchmark得分也遠超其他同類模型。Imagen 3目前已開放使用，用戶可直接體驗其強大的生成能力。
谷歌與OpenAI的AI競賽：級更新vs.炒作過度？
谷歌此次發布的Veo 2和Imagen 3，與OpenAI近期持續發布新產品形成鮮明對比。谷歌的更新更側重于技術實力的展現，每次發布都具有“級”的影響力，例如Gemini 2.0和這次的Veo 2都搶占了OpenAI的風頭。而OpenAI則被部分評論認為存在過度炒作的情況，預告的12天直播雖然吸引了大量關注，但實際發布內容未能完全滿足用戶的期待。 Veo 2目前僅通過VideoFX平臺提供版（8秒720p視頻），完整版將于未來幾個月陸續推出。盡管如此，其性能仍遠超Sora。

總而言之，谷歌此次AI反擊戰可謂聲勢浩大，Veo 2和Imagen 3的驚艷表現為AI技術發展樹立了新的標桿，也為這場AI巨頭之間的競爭增添了更多看點。未來，谷歌和OpenAI之間的較量將持續引發關注。

聯系作者

文章來源：夕小瑤科技說
作者微信：
作者簡介：低負擔解碼AI世界，硬核也可愛！聚集35萬AI發燒友、開發者和從業者，廣泛覆蓋互聯網大廠中高管、AI公司創始人和機構投資人。一線作者來自清北、國內外頂級AI實驗室和大廠，兼備敏銳的行業嗅覺和洞察深度。商務合作：zym5189

閱讀原文

# AIGC動態 # AI生成內容尺度控制 # AI視頻生成技術 # Sora視頻生成模型 # Veo-2視頻生成模型 # 大型語言模型視頻應用

文章版權歸作者所有，未經允許請勿轉載。

暫無評論

暫無評論...

国产精品亚洲mnbav网站_成人午夜亚洲精品无码网站_日韩va亚洲va欧洲va国产_亚洲欧洲精品成人久久曰影片

錘爆Sora，尺度最大，谷歌發布最強視頻模型Veo2，叫板海螺可靈

谷歌AI反擊戰：Veo 2和Imagen 3強勢來襲，OpenAI的Sora黯然失色

Veo 2：年度最佳視頻生成模型？

Imagen 3：細節更勝一籌的文生圖模型

谷歌與OpenAI的AI競賽：級更新vs.炒作過度？

聯系作者

北大開源全新圖像壓縮感知網絡：參數量、推理時間大幅節省，性能顯著提升 | 頂刊TPAMI

探索概率的幻影：我們為何依然堅持使用它？

相關文章

暫無評論

ChatGPT

玩虛擬模特？