錘爆Sora,尺度最大,谷歌發(fā)布最強(qiáng)視頻模型Veo2,叫板海螺可靈
原標(biāo)題:錘爆Sora,尺度最大,谷歌發(fā)布最強(qiáng)視頻模型Veo2,叫板海螺可靈
文章來源:夕小瑤科技說
內(nèi)容字?jǐn)?shù):10917字
谷歌AI反擊戰(zhàn):Veo 2和Imagen 3強(qiáng)勢來襲,OpenAI的Sora黯然失色
近期,谷歌DeepMind強(qiáng)勢發(fā)布了兩個重量級AI模型,直接挑戰(zhàn)OpenAI的領(lǐng)先地位。其中,視頻生成模型Veo 2以其卓越的性能,引發(fā)業(yè)界廣泛關(guān)注,而文生圖模型Imagen 3也展現(xiàn)出令人驚艷的細(xì)節(jié)和光照效果。此舉被視為谷歌對OpenAI近期一系列產(chǎn)品發(fā)布的強(qiáng)力反擊。
Veo 2:年度最佳視頻生成模型?
Veo 2在視頻生成時長、分辨率和質(zhì)量上全面超越OpenAI的Sora。Sora 20美元版本僅能生成5秒720p視頻,而200美元版本也只有20秒1080p。相比之下,Veo 2可生成約2分鐘4K高清視頻。在第三方評測中,Veo 2在整體滿意度和指令遵循度上均優(yōu)于Sora、Meta Movie Gen、Kling v1.5和Minimax等模型。Veo 2的顯著改進(jìn)體現(xiàn)在保真度(細(xì)節(jié)真實,減少偽影)、準(zhǔn)確度(理解物理世界,精準(zhǔn)遵循指令)和相機(jī)控制(掌握電影攝影技巧,可創(chuàng)建各種拍攝風(fēng)格)等方面。眾多官方演示視頻展示了Veo 2在模擬真實場景(如切西紅柿、早餐場景、動物游泳等)和虛構(gòu)場景(如夢境般的光影效果)方面的出色表現(xiàn),其生成的視頻質(zhì)量已達(dá)到以假亂真的程度。
Imagen 3:細(xì)節(jié)更勝一籌的文生圖模型
除了Veo 2,谷歌還同步發(fā)布了Imagen 3文生圖模型。該模型在圖像細(xì)節(jié)、光照效果和減少干擾方面均有顯著提升,其benchmark得分也遠(yuǎn)超其他同類模型。Imagen 3目前已開放使用,用戶可直接體驗其強(qiáng)大的生成能力。
谷歌與OpenAI的AI競賽:級更新vs.炒作過度?
谷歌此次發(fā)布的Veo 2和Imagen 3,與OpenAI近期持續(xù)發(fā)布新產(chǎn)品形成鮮明對比。谷歌的更新更側(cè)重于技術(shù)實力的展現(xiàn),每次發(fā)布都具有“級”的影響力,例如Gemini 2.0和這次的Veo 2都搶占了OpenAI的風(fēng)頭。而OpenAI則被部分評論認(rèn)為存在過度炒作的情況,預(yù)告的12天直播雖然吸引了大量關(guān)注,但實際發(fā)布內(nèi)容未能完全滿足用戶的期待。 Veo 2目前僅通過VideoFX平臺提供版(8秒720p視頻),完整版將于未來幾個月陸續(xù)推出。盡管如此,其性能仍遠(yuǎn)超Sora。
總而言之,谷歌此次AI反擊戰(zhàn)可謂聲勢浩大,Veo 2和Imagen 3的驚艷表現(xiàn)為AI技術(shù)發(fā)展樹立了新的標(biāo)桿,也為這場AI巨頭之間的競爭增添了更多看點(diǎn)。未來,谷歌和OpenAI之間的較量將持續(xù)引發(fā)關(guān)注。
聯(lián)系作者
文章來源:夕小瑤科技說
作者微信:
作者簡介:低負(fù)擔(dān)解碼AI世界,硬核也可愛!聚集35萬AI發(fā)燒友、開發(fā)者和從業(yè)者,廣泛覆蓋互聯(lián)網(wǎng)大廠中高管、AI公司創(chuàng)始人和機(jī)構(gòu)投資人。一線作者來自清北、國內(nèi)外頂級AI實驗室和大廠,兼?zhèn)涿翡J的行業(yè)嗅覺和洞察深度。商務(wù)合作:zym5189