從\x26quot;神話\x26quot;到\x26quot;笑話\x26quot;,Sora只用了短短10個月,Google veo來得正當時
原標題:Sora翻車后,Google王炸降臨:AI視頻迎來真正的實力派
文章來源:AI范兒
內容字數:3857字
Google Veo 2:AI視頻生成領域的“真玩家”
本文總結了Google近期發布的Veo 2、Imagen 3和Whisk三個AI工具,并分析了Google在AI創意領域的戰略布局。
Sora的滑鐵盧與Veo 2的崛起
文章開篇以OpenAI的Sora模型為例,對比了其發布初期的高期待和后期用戶反饋的巨大落差。 Google Veo 2的發布,正是在這種背景下顯得尤為重要。雖然起初作者也抱有懷疑態度,但深入研究后發現Veo 2在4K高清視頻輸出、對專業攝影語言的理解以及對物理世界的還原度上都有顯著提升,在MovieGenBench測試中也表現出色,優于Sora Turbo。
Veo 2的技術實力與優勢
Veo 2的技術亮點在于其對專業攝影知識的掌握,例如低角度推軌、廣角鏡頭效果、淺景深虛化等,甚至連資深攝影師都對其技術水平表示贊賞。 此外,Veo 2在處理物理世界的合理性方面也比其他AI模型有顯著進步,減少了“鬼畜”場景的出現。 文章也客觀地指出了Veo 2在處理復雜場景和長時間動作連貫性方面仍需改進。
Imagen 3:全能藝術家級的圖像生成
除了Veo 2,Google還推出了Imagen 3,一個能夠駕馭多種藝術風格(從寫實到抽象)的圖像生成模型。Imagen 3更精準地理解用戶提示詞,生成細節更豐富、紋理更逼真的圖像,在人工評測中表現優異。
Whisk:創意實驗的數字煉金術
Whisk是一個創意實驗平臺,允許用戶輸入靈感圖片,系統利用Gemini的視覺理解能力解讀圖片,并通過Imagen 3將創意轉化為現實,例如毛絨玩具或琺瑯別針等。它為創作者提供了一個進行創意轉化和重組的“數字煉金術實驗室”。
Google的AI創意生態系統戰略
Google的戰略并非局限于單個AI工具的競爭,而是構建一個完整的AI創意生態系統。Veo 2、Imagen 3和Whisk三個工具協同工作,覆蓋從靈感獲取到作品創作的全過程。Google采用Google Labs平臺進行全球同步發布,并為所有AI生成內容添加SynthID水印,體現了其對用戶反饋和內容安全的重視。
未來展望:AI創意產業的新巨頭?
文章最后探討了Google在AI創意領域的領先地位及其對未來創意產業的影響,暗示Google可能成為AI創意平臺的新巨頭。
聯系作者
文章來源:AI范兒
作者微信:
作者簡介:專注于探索 AIGC,發掘人工智能的樂趣。