震撼來襲!谷歌Veo2視頻模型挑戰(zhàn)海螺可靈,打破極限的視覺盛宴!
原標(biāo)題:錘爆Sora,尺度最大,谷歌發(fā)布最強視頻模型Veo2,叫板海螺可靈
文章來源:夕小瑤科技說
內(nèi)容字?jǐn)?shù):10917字
谷歌Veo 2與Imagen 3重磅發(fā)布
近期,谷歌在OpenAI發(fā)布會之前推出了兩個重磅更新,分別是視頻生成模型Veo 2和文生圖模型Imagen 3。這些新產(chǎn)品在生成視頻和圖像的能力上表現(xiàn)出色,顯然是對OpenAI的回應(yīng)。
1. Veo 2的視頻生成能力
谷歌的Veo 2模型能夠生成高達4K分辨率、約2分鐘的視頻,表現(xiàn)出極高的表現(xiàn)力和細(xì)節(jié)保真度。與OpenAI的Sora相比,Veo 2在生成視頻時的參數(shù)和基準(zhǔn)測試結(jié)果均大幅領(lǐng)先,提供了更長的時長和更高的分辨率。
2. 精準(zhǔn)的指令遵循
Veo 2在理解物理世界和遵循詳細(xì)指令方面也有顯著進步。用戶可以輸入復(fù)雜的提示語,模型能夠生動地再現(xiàn)各種場景,展現(xiàn)出優(yōu)秀的陰影、反射和力學(xué)效果。例如,Veo 2能夠自然地處理物體之間的互動,生成的畫面仿佛真實拍攝而成。
3. 展示效果及用戶反饋
谷歌還展示了多段Veo 2生成的視頻,涵蓋從場景到靜物攝影的多種主題。用戶可以通過VideoFX平臺進行體驗,但目前該平臺僅開放了Veo 2的試用版,用戶需申請加入等待名單。
4. Imagen 3的圖像生成能力
除了Veo 2,谷歌還發(fā)布了Imagen 3模型,具備更好的圖像細(xì)節(jié)和光照效果。用戶可以直接使用Imagen 3進行圖像生成,體驗其強大的視覺表現(xiàn)力。
5. 谷歌的快速迭代與未來展望
谷歌DeepMind的副總裁Eli Collins表示,Veo 2會根據(jù)用戶反饋進行迭代更新,并預(yù)計明年將推出更多功能。與OpenAI的逐步釋放不同,谷歌的交付速度備受期待。
總的來說,谷歌的Veo 2和Imagen 3在AI視頻和圖像生成領(lǐng)域展現(xiàn)了強大的競爭力,勢必對OpenAI造成壓力,未來的發(fā)展值得用戶關(guān)注。
聯(lián)系作者
文章來源:夕小瑤科技說
作者微信:
作者簡介:解碼AI世界,硬核也可愛!聚集35萬AI發(fā)燒友、開發(fā)者和從業(yè)者,廣泛覆蓋互聯(lián)網(wǎng)大廠中高管、AI公司創(chuàng)始人和機構(gòu)投資人。一線作者來自清北、國內(nèi)外頂級AI實驗室和大廠,兼?zhèn)涿翡J的行業(yè)嗅覺和洞察深度。商務(wù)合作:zym5189