突破AI理解現(xiàn)實世界物理和瓶頸
原標題:谷歌發(fā)布AI視頻模型Veo2,王者歸來
文章來源:科技未來派
內(nèi)容字數(shù):3816字
谷歌新發(fā)布的Veo 2:視頻生成的未來
大家好,我是小風(fēng)。最近,谷歌推出了其最新的視頻生成模型——Veo 2。這一創(chuàng)新在Meta發(fā)布的MovieGenBench基準數(shù)據(jù)集上進行了測試,涉及1003個提示詞及其對應(yīng)的視頻,評估結(jié)果顯示,Veo 2在整體偏好及準確遵循提示詞方面表現(xiàn)最佳,超越了其他模型,如Sora、Meta的Movie Gen、可靈和海螺。
Veo 2的突出特點
Veo 2具備多個令人矚目的特點:
- 能夠生成最高4K分辨率的視頻。
- 理解提示中的相機控制,包括遠景、視角和無人機鏡頭。
- 更好地重現(xiàn)現(xiàn)實世界的物理現(xiàn)象和真實的人類表情。
尤為重要的是,Veo 2在理解物理世界方面的能力有了顯著提升,這是目前許多AI視頻模型尚未能很好實現(xiàn)的。
實際效果與示例
接下來,我們來看看Veo 2的官方演示視頻以及網(wǎng)友的實測效果。
在官方放出的兩個演示視頻中,我們可以明顯看到Veo 2對物體的物理理解能力非常出色。
網(wǎng)友實測效果展示
1. 一位孤獨的漁夫在巨大的風(fēng)暴中,穿著破舊的雨衣,努力保持平衡,拋出釣線到?jīng)坝康乃嫔稀_@個場景生動地再現(xiàn)了惡劣天氣下的艱難處境。
2. 一輛汽車在道路上以最高速度行駛,直到到達瀑布,它勇敢地躍入瀑布并從山上跳下,展現(xiàn)出極具電影感的視覺效果。
3. 一個急診創(chuàng)傷團隊正在全力以赴地復(fù)蘇一名車禍受害者,雖然這個復(fù)雜場景的細節(jié)有些出入,但整體表現(xiàn)依然令人印象深刻。
4. 一幅人類與機器人對峙的畫面,攝像機聚焦于他們相觸的食指,但缺少了他們?nèi)诤铣沙祟惖谋憩F(xiàn)。
5. 一艘太陽能無人水面艦艇在平靜的海面上漂浮,設(shè)計現(xiàn)代,顯現(xiàn)出科技與自然環(huán)境之間的對比。
6. 一只貓在鏡子前吼叫,卻把自己想象成獅子,這個創(chuàng)意場景讓人忍俊不禁。
7. 一場動物會議,獅子、熊和長頸鹿穿著西裝,逼真且富有電影感的場景引人注目。
如何體驗Veo 2
目前,谷歌的Veo 2正在進行早期訪問申請,感興趣的小伙伴可以訪問官方網(wǎng)站進行申請,網(wǎng)址為:https://veo2.org/。
加入我們的AI交流群
另外,我正在準備拉一個免費的AI交流群,感興趣的朋友可以在公眾號后臺回復(fù)“進群”,我將統(tǒng)計并邀請大家一起交流。
感謝大家的關(guān)注,記得設(shè)置星標,以便及時獲取更多AI前沿資訊!
精彩推薦文章
- 太牛了!手把手教你AI試衣?lián)Q裝,穿衣搭配零成本
- 贊爆!即夢AI文生圖支持直出中文字,從此海報
- 騰訊版Sora來了!吊打一眾AI視頻模型
- 即夢AI上線PixelDance視頻模型,一手實測
- 可靈AI正式上線一致性角色功能
- 手把手教你制作口播視頻,只需要會念“123456”就行
聯(lián)系作者
文章來源:科技未來派
作者微信:
作者簡介:追蹤人工智能新趨勢,關(guān)注科技行業(yè)新突破