Sora翻車后,Google王炸降臨:AI視頻迎來真正的實力派
從\x26quot;神話\x26quot;到\x26quot;笑話\x26quot;,Sora只用了短短10個月,Google veo來得正當時

原標題:Sora翻車后,Google王炸降臨:AI視頻迎來真正的實力派
文章來源:AI范兒
內(nèi)容字數(shù):3857字
Google Veo 2:AI視頻生成領(lǐng)域的“真玩家”
本文總結(jié)了Google近期發(fā)布的Veo 2、Imagen 3和Whisk三個AI工具,并分析了Google在AI創(chuàng)意領(lǐng)域的戰(zhàn)略布局。
Sora的滑鐵盧與Veo 2的崛起
文章開篇以OpenAI的Sora模型為例,對比了其發(fā)布初期的高期待和后期用戶反饋的巨大落差。 Google Veo 2的發(fā)布,正是在這種背景下顯得尤為重要。雖然起初作者也抱有懷疑態(tài)度,但深入研究后發(fā)現(xiàn)Veo 2在4K高清視頻輸出、對專業(yè)攝影語言的理解以及對物理世界的還原度上都有顯著提升,在MovieGenBench測試中也表現(xiàn)出色,優(yōu)于Sora Turbo。
Veo 2的技術(shù)實力與優(yōu)勢
Veo 2的技術(shù)亮點在于其對專業(yè)攝影知識的掌握,例如低角度推軌、廣角鏡頭效果、淺景深虛化等,甚至連資深攝影師都對其技術(shù)水平表示贊賞。 此外,Veo 2在處理物理世界的合理性方面也比其他AI模型有顯著進步,減少了“鬼畜”場景的出現(xiàn)。 文章也客觀地指出了Veo 2在處理復(fù)雜場景和長時間動作連貫性方面仍需改進。
Imagen 3:全能藝術(shù)家級的圖像生成
除了Veo 2,Google還推出了Imagen 3,一個能夠駕馭多種藝術(shù)風格(從寫實到抽象)的圖像生成模型。Imagen 3更精準地理解用戶提示詞,生成細節(jié)更豐富、紋理更逼真的圖像,在人工評測中表現(xiàn)優(yōu)異。
Whisk:創(chuàng)意實驗的數(shù)字煉金術(shù)
Whisk是一個創(chuàng)意實驗平臺,允許用戶輸入靈感圖片,系統(tǒng)利用Gemini的視覺理解能力解讀圖片,并通過Imagen 3將創(chuàng)意轉(zhuǎn)化為現(xiàn)實,例如毛絨玩具或琺瑯別針等。它為創(chuàng)作者提供了一個進行創(chuàng)意轉(zhuǎn)化和重組的“數(shù)字煉金術(shù)實驗室”。
Google的AI創(chuàng)意生態(tài)系統(tǒng)戰(zhàn)略
Google的戰(zhàn)略并非局限于單個AI工具的競爭,而是構(gòu)建一個完整的AI創(chuàng)意生態(tài)系統(tǒng)。Veo 2、Imagen 3和Whisk三個工具協(xié)同工作,覆蓋從靈感獲取到作品創(chuàng)作的全過程。Google采用Google Labs平臺進行全球同步發(fā)布,并為所有AI生成內(nèi)容添加SynthID水印,體現(xiàn)了其對用戶反饋和內(nèi)容安全的重視。
未來展望:AI創(chuàng)意產(chǎn)業(yè)的新巨頭?
文章最后探討了Google在AI創(chuàng)意領(lǐng)域的領(lǐng)先地位及其對未來創(chuàng)意產(chǎn)業(yè)的影響,暗示Google可能成為AI創(chuàng)意平臺的新巨頭。
聯(lián)系作者
文章來源:AI范兒
作者微信:
作者簡介:專注于探索 AIGC,發(fā)掘人工智能的樂趣。

粵公網(wǎng)安備 44011502001135號