顛覆視界:谷歌Sora深夜發(fā)布,4K視頻生成新時(shí)代震撼來(lái)襲!
原標(biāo)題:再度OpenAI!“谷歌版”Sora深夜上線,4k視頻生成時(shí)代來(lái)了
文章來(lái)源:人工智能學(xué)家
內(nèi)容字?jǐn)?shù):7502字
谷歌推出全新視頻與圖像生成模型
在今日凌晨,谷歌正式宣布推出其最新的生成模型——Veo 2和Imagen 3,旨在進(jìn)一步提升視頻與圖像的生成質(zhì)量,稱其已達(dá)到當(dāng)前的最高標(biāo)準(zhǔn)(SOTA)。這兩款模型的發(fā)布,標(biāo)志著谷歌在生成技術(shù)領(lǐng)域的一次重大進(jìn)展,意在與OpenAI等競(jìng)爭(zhēng)對(duì)手形成競(jìng)爭(zhēng)。
1. Veo 2:SOTA視頻生成
Veo 2是谷歌新推出的視頻生成模型,表現(xiàn)出色。根據(jù)人類評(píng)價(jià)者的測(cè)試,Veo 2在畫質(zhì)、細(xì)節(jié)和真實(shí)性方面均達(dá)到SOTA水準(zhǔn)。該模型對(duì)現(xiàn)實(shí)物理、人體動(dòng)作和表情的理解更加深入,生成的視頻內(nèi)容更加真實(shí)。用戶可以通過提示詞來(lái)定制場(chǎng)景效果,包括鏡頭類型和畫面風(fēng)格,生成高達(dá)4K分辨率、時(shí)長(zhǎng)數(shù)分鐘的視頻。
2. Veo 2的技術(shù)特點(diǎn)
Veo 2的技術(shù)能力包括減少生成視頻中不必要的細(xì)節(jié)(如多余的手指)的問題,增強(qiáng)輸出內(nèi)容的真實(shí)性。此外,為了確保生成技術(shù)的安全性,Veo 2采用了無(wú)形水印技術(shù)SynthID,以識(shí)別AI生成內(nèi)容,從而降低誤導(dǎo)信息傳播的風(fēng)險(xiǎn)。
3. Imagen 3:圖像生成模型再升級(jí)
谷歌還對(duì)其圖像生成模型Imagen進(jìn)行了全面升級(jí)。升級(jí)后的Imagen 3在生成質(zhì)量上超過多個(gè)競(jìng)爭(zhēng)對(duì)手,支持更豐富的藝術(shù)風(fēng)格,從寫實(shí)主義到動(dòng)漫風(fēng)格,用戶可以獲得更高質(zhì)量和多樣化的圖像生成體驗(yàn)。
4. Whisk:基于圖像的創(chuàng)意工具
此外,谷歌還推出了Whisk,一個(gè)基于圖像的創(chuàng)意可視化工具。Whisk允許用戶輸入或創(chuàng)建圖像,并結(jié)合Imagen 3的技術(shù)能力,自動(dòng)生成詳細(xì)描述,以實(shí)現(xiàn)對(duì)場(chǎng)景和風(fēng)格的靈活組合,滿足各種創(chuàng)意需求。
總結(jié)
谷歌的Veo 2和Imagen 3模型的推出,不僅展示了其在視頻和圖像生成領(lǐng)域的技術(shù)實(shí)力,也為用戶提供了更高質(zhì)量的創(chuàng)作工具。隨著這些技術(shù)的逐步開放,未來(lái)用戶在創(chuàng)作方面將有更多的可能性。
聯(lián)系作者
文章來(lái)源:人工智能學(xué)家
作者微信:
作者簡(jiǎn)介:致力成為權(quán)威的人工智能科技媒體和前沿科技研究機(jī)構(gòu)