再度OpenAI!“谷歌版”Sora深夜上線,4k視頻生成時(shí)代來(lái)了
原標(biāo)題:再度OpenAI!“谷歌版”Sora深夜上線,4k視頻生成時(shí)代來(lái)了
文章來(lái)源:人工智能學(xué)家
內(nèi)容字?jǐn)?shù):7502字
谷歌強(qiáng)勢(shì)推出Veo 2和Imagen 3,AI圖像視頻生成再升級(jí)
近日,谷歌發(fā)布了全新視頻生成模型Veo 2和圖像生成模型Imagen 3的升級(jí)版本,在圖像和視頻生成領(lǐng)域取得了顯著突破,并宣稱(chēng)達(dá)到了當(dāng)前最佳水平(SOTA)。 此舉被解讀為谷歌對(duì)OpenAI的直接,標(biāo)志著AI生成內(nèi)容領(lǐng)域的競(jìng)爭(zhēng)進(jìn)一步加劇。
1. Veo 2:高質(zhì)量視頻生成的里程碑
Veo 2是谷歌最新研發(fā)的視頻生成模型,其生成視頻在畫(huà)質(zhì)、細(xì)節(jié)和真實(shí)性方面均達(dá)到SOTA水平。它對(duì)物理規(guī)律、人體動(dòng)作和表情的理解更深入,生成的視頻更加逼真。Veo 2支持用戶(hù)通過(guò)提示詞自定義場(chǎng)景效果,例如指定鏡頭類(lèi)型、畫(huà)面風(fēng)格或電影特效,甚至可以生成分辨率高達(dá)4K、時(shí)長(zhǎng)達(dá)數(shù)分鐘的視頻。 此外,Veo 2還采用了SynthID無(wú)形水印技術(shù),以確保生成內(nèi)容的安全性和負(fù)責(zé)任的使用,降低虛假信息傳播的風(fēng)險(xiǎn)。未來(lái),Veo 2的功能將逐步集成到VideoFX、YouTube、Vertex AI等谷歌產(chǎn)品中。
2. Imagen 3:圖像生成能力全面提升
Imagen 3進(jìn)行了全面升級(jí),圖像生成效果更明亮、構(gòu)圖更精美,并支持更多藝術(shù)風(fēng)格,從寫(xiě)實(shí)到抽象,涵蓋范圍更廣。 升級(jí)后的模型在細(xì)節(jié)和材質(zhì)表現(xiàn)上更為豐富,對(duì)提示詞的響應(yīng)也更加準(zhǔn)確,在人類(lèi)評(píng)價(jià)測(cè)試中超過(guò)多個(gè)領(lǐng)先的圖像生成模型,同樣達(dá)到了SOTA水平。Imagen 3已通過(guò)ImageFX工具在全球100多個(gè)國(guó)家開(kāi)放使用。
3. Whisk:創(chuàng)意可視化工具,賦能用戶(hù)創(chuàng)造力
谷歌還推出了基于Imagen 3和Gemini模型的創(chuàng)意可視化工具Whisk。用戶(hù)可以通過(guò)輸入或創(chuàng)建圖像,并結(jié)合Whisk的功能,將不同的圖像組合、重新混合,創(chuàng)造出獨(dú)一無(wú)二的作品。Gemini模型能夠自動(dòng)為用戶(hù)上傳的圖像生成詳細(xì)描述,并將其輸入Imagen 3,從而實(shí)現(xiàn)對(duì)場(chǎng)景、風(fēng)格和主體的靈活控制,極大拓展了用戶(hù)的創(chuàng)作空間。
4. 未來(lái)展望與行業(yè)競(jìng)爭(zhēng)
谷歌此次發(fā)布的Veo 2和Imagen 3,以及創(chuàng)意工具Whisk,展示了其在AI圖像和視頻生成領(lǐng)域的領(lǐng)先地位,并預(yù)示著未來(lái)AI生成內(nèi)容將更加高質(zhì)量、更易于使用,并應(yīng)用于更廣泛的領(lǐng)域。 同時(shí),這也加劇了谷歌與OpenAI等公司在AI領(lǐng)域的競(jìng)爭(zhēng),未來(lái)將呈現(xiàn)更多創(chuàng)新和突破。
文章最后還列舉了歐米伽未來(lái)研究所“未來(lái)知識(shí)庫(kù)”中收錄的100多篇關(guān)于前沿科技趨勢(shì)的報(bào)告,涵蓋人工智能、能源、經(jīng)濟(jì)、生物科技等多個(gè)領(lǐng)域,體現(xiàn)了對(duì)未來(lái)科技發(fā)展趨勢(shì)的持續(xù)關(guān)注。
聯(lián)系作者
文章來(lái)源:人工智能學(xué)家
作者微信:
作者簡(jiǎn)介:致力成為權(quán)威的人工智能科技媒體和前沿科技研究機(jī)構(gòu)