再度OpenAI！“谷歌版”Sora深夜上線，4k視頻生成時(shí)代來(lái)了

AIGC動(dòng)態(tài)9個(gè)月前發(fā)布人工智能學(xué)家

再度狙擊OpenAI！“谷歌版”Sora深夜上線，4k視頻生成時(shí)代來(lái)了

原標(biāo)題：再度OpenAI！“谷歌版”Sora深夜上線，4k視頻生成時(shí)代來(lái)了
文章來(lái)源：人工智能學(xué)家
內(nèi)容字?jǐn)?shù)：7502字

谷歌強(qiáng)勢(shì)推出Veo 2和Imagen 3，AI圖像視頻生成再升級(jí)

近日，谷歌發(fā)布了全新視頻生成模型Veo 2和圖像生成模型Imagen 3的升級(jí)版本，在圖像和視頻生成領(lǐng)域取得了顯著突破，并宣稱(chēng)達(dá)到了當(dāng)前最佳水平（SOTA）。此舉被解讀為谷歌對(duì)OpenAI的直接，標(biāo)志著AI生成內(nèi)容領(lǐng)域的競(jìng)爭(zhēng)進(jìn)一步加劇。

1. Veo 2：高質(zhì)量視頻生成的里程碑

Veo 2是谷歌最新研發(fā)的視頻生成模型，其生成視頻在畫(huà)質(zhì)、細(xì)節(jié)和真實(shí)性方面均達(dá)到SOTA水平。它對(duì)物理規(guī)律、人體動(dòng)作和表情的理解更深入，生成的視頻更加逼真。Veo 2支持用戶(hù)通過(guò)提示詞自定義場(chǎng)景效果，例如指定鏡頭類(lèi)型、畫(huà)面風(fēng)格或電影特效，甚至可以生成分辨率高達(dá)4K、時(shí)長(zhǎng)達(dá)數(shù)分鐘的視頻。此外，Veo 2還采用了SynthID無(wú)形水印技術(shù)，以確保生成內(nèi)容的安全性和負(fù)責(zé)任的使用，降低虛假信息傳播的風(fēng)險(xiǎn)。未來(lái)，Veo 2的功能將逐步集成到VideoFX、YouTube、Vertex AI等谷歌產(chǎn)品中。

2. Imagen 3：圖像生成能力全面提升

Imagen 3進(jìn)行了全面升級(jí)，圖像生成效果更明亮、構(gòu)圖更精美，并支持更多藝術(shù)風(fēng)格，從寫(xiě)實(shí)到抽象，涵蓋范圍更廣。升級(jí)后的模型在細(xì)節(jié)和材質(zhì)表現(xiàn)上更為豐富，對(duì)提示詞的響應(yīng)也更加準(zhǔn)確，在人類(lèi)評(píng)價(jià)測(cè)試中超過(guò)多個(gè)領(lǐng)先的圖像生成模型，同樣達(dá)到了SOTA水平。Imagen 3已通過(guò)ImageFX工具在全球100多個(gè)國(guó)家開(kāi)放使用。

3. Whisk：創(chuàng)意可視化工具，賦能用戶(hù)創(chuàng)造力

谷歌還推出了基于Imagen 3和Gemini模型的創(chuàng)意可視化工具Whisk。用戶(hù)可以通過(guò)輸入或創(chuàng)建圖像，并結(jié)合Whisk的功能，將不同的圖像組合、重新混合，創(chuàng)造出獨(dú)一無(wú)二的作品。Gemini模型能夠自動(dòng)為用戶(hù)上傳的圖像生成詳細(xì)描述，并將其輸入Imagen 3，從而實(shí)現(xiàn)對(duì)場(chǎng)景、風(fēng)格和主體的靈活控制，極大拓展了用戶(hù)的創(chuàng)作空間。

4. 未來(lái)展望與行業(yè)競(jìng)爭(zhēng)

谷歌此次發(fā)布的Veo 2和Imagen 3，以及創(chuàng)意工具Whisk，展示了其在AI圖像和視頻生成領(lǐng)域的領(lǐng)先地位，并預(yù)示著未來(lái)AI生成內(nèi)容將更加高質(zhì)量、更易于使用，并應(yīng)用于更廣泛的領(lǐng)域。同時(shí)，這也加劇了谷歌與OpenAI等公司在AI領(lǐng)域的競(jìng)爭(zhēng)，未來(lái)將呈現(xiàn)更多創(chuàng)新和突破。

文章最后還列舉了歐米伽未來(lái)研究所“未來(lái)知識(shí)庫(kù)”中收錄的100多篇關(guān)于前沿科技趨勢(shì)的報(bào)告，涵蓋人工智能、能源、經(jīng)濟(jì)、生物科技等多個(gè)領(lǐng)域，體現(xiàn)了對(duì)未來(lái)科技發(fā)展趨勢(shì)的持續(xù)關(guān)注。

聯(lián)系作者

文章來(lái)源：人工智能學(xué)家
作者微信：
作者簡(jiǎn)介：致力成為權(quán)威的人工智能科技媒體和前沿科技研究機(jī)構(gòu)

閱讀原文

# AIGC動(dòng)態(tài)# 4K視頻AI生成 # AI視頻生成模型 # Sora視頻生成 # 谷歌AI視頻生成技術(shù)# 高分辨率AI視頻生成

? 版權(quán)聲明

文章版權(quán)歸作者所有，未經(jīng)允許請(qǐng)勿轉(zhuǎn)載。

暫無(wú)評(píng)論

暫無(wú)評(píng)論...

国产精品亚洲mnbav网站_成人午夜亚洲精品无码网站_日韩va亚洲va欧洲va国产_亚洲欧洲精品成人久久曰影片

再度OpenAI！“谷歌版”Sora深夜上線，4k視頻生成時(shí)代來(lái)了

谷歌強(qiáng)勢(shì)推出Veo 2和Imagen 3，AI圖像視頻生成再升級(jí)

1. Veo 2：高質(zhì)量視頻生成的里程碑

2. Imagen 3：圖像生成能力全面提升

3. Whisk：創(chuàng)意可視化工具，賦能用戶(hù)創(chuàng)造力

4. 未來(lái)展望與行業(yè)競(jìng)爭(zhēng)

聯(lián)系作者

Pika 2.0橫掃Sora驚艷全網(wǎng)，一鍵顛覆廣告業(yè)！上傳自拍秒變好萊塢大片，和明星同框不是夢(mèng)

AGI時(shí)代的未來(lái)：探索分布式大模型智能體系統(tǒng)的無(wú)限可能

相關(guān)文章

暫無(wú)評(píng)論

ChatGPT

玩虛擬模特？