48個演示視頻,最長60秒,看懂OpenAI視頻大模型Sora
AIGC動態(tài)歡迎閱讀
原標(biāo)題:48個演示視頻,最長60秒,看懂OpenAI視頻大模型Sora
關(guān)鍵字:視頻,提示,模型,政策,報告
文章來源:人工智能學(xué)家
內(nèi)容字數(shù):7899字
內(nèi)容摘要:
來源:本文轉(zhuǎn)載自:深網(wǎng)騰訊新聞
繼ChatGPT之后,OpenAI又推出一款震驚科技圈的產(chǎn)品。
今日凌晨,OpenAI宣布推出文生視頻大模型——Sora。
據(jù)介紹,Sora可以創(chuàng)建長達60秒的視頻,具有非常詳細的場景,復(fù)雜的攝像機,和充滿活力的情感的多個角色。
OpenAI:Sora了解用戶在提示中要求的內(nèi)容
還了解這些東西在物理世界中的存在方式
據(jù)其官網(wǎng)介紹,OpenAI正在教人工智能理解和模擬中的物理世界,目標(biāo)是訓(xùn)練模型,幫助人們解決需要現(xiàn)實世界交互的問題。
其文生視頻模型Sora,可以生成長達一分鐘的視頻,同時保持視覺質(zhì)量并遵守用戶的提示。
Sora能夠生成具有多個角色、特定類型的以及主題和背景的準確細節(jié)的復(fù)雜場景。該模型不僅了解用戶在提示中要求的內(nèi)容,還了解這些東西在物理世界中的存在方式。
該模型對語言有深刻的理解,使其能夠準確地解釋提示并生成表達生動情感的引人注目的角色。Sora還可以在單個生成的視頻中創(chuàng)建多個鏡頭,以準確保留角色和視覺風(fēng)格。
從其官網(wǎng)介紹來看,Sora是一種擴散模型,它通過從一個看起來像靜態(tài)噪聲的視頻開始生成視頻,然后通過多步去除噪聲來逐漸轉(zhuǎn)換視
原文鏈接:48個演示視頻,最長60秒,看懂OpenAI視頻大模型Sora
聯(lián)系作者
文章來源:人工智能學(xué)家
作者微信:AItists
作者簡介:致力成為權(quán)威的人工智能科技媒體和前沿科技研究機構(gòu)