OpenAI發(fā)布強大的視頻生成工具,讓整個行業(yè)哀鴻遍野
AIGC動態(tài)歡迎閱讀
原標題:OpenAI發(fā)布強大的視頻生成工具,讓整個行業(yè)哀鴻遍野
關(guān)鍵字:公告,政策,模型,視頻,視覺
文章來源:AI范兒
內(nèi)容字數(shù):2574字
內(nèi)容摘要:
點擊上方藍字關(guān)注我們“OpenAI發(fā)布了最新產(chǎn)品Sora,能憑文本生成60秒生動視頻。Sora融合語言與圖像生成技術(shù),實現(xiàn)了連貫的場景轉(zhuǎn)換,包括細節(jié)如頭發(fā)、服裝,以及面部表情和聲音的同步。模型基于變換器架構(gòu),通過逐幀學習文本描述和視覺表現(xiàn)之間的復雜映射,處理各種視覺數(shù)據(jù)。OpenAI今日宣布了他們最新的產(chǎn)品——Sora。這一模型令人印象深刻,能夠僅憑文本提示生成生動的60秒視頻。盡管已經(jīng)有了Runway和Pika等模型可以生成逼真視頻,但據(jù)我們所見,Sora很可能是目前最先進的。
Sora在功能和性能上碾壓其他產(chǎn)品,令整個行業(yè)哀鴻遍野。其令人驚嘆的表現(xiàn)引發(fā)了業(yè)內(nèi)的震驚,連Runway創(chuàng)始人都說:戰(zhàn)斗開始。也有網(wǎng)友說,請為以下公司默哀一分鐘:(那幾乎是整個AI視頻生成行業(yè))
Sora不僅能夠理解詳細的提示,還能通過動作和視覺敘事重新創(chuàng)造出物理世界的動態(tài),這一點令人難以置信。正如官方公告所述,Sora是OpenAI在語言和圖像生成領(lǐng)域先前工作的基礎(chǔ)上發(fā)展而來的。雖然之前的DALLE能夠生成靜態(tài)場景,但Sora引入了流動感和連貫性,能夠在不同鏡頭之間無縫過渡,同時保持上下文和對原始文本提示的
原文鏈接:OpenAI發(fā)布強大的視頻生成工具,讓整個行業(yè)哀鴻遍野
聯(lián)系作者
文章來源:AI范兒
作者微信:AI_Insights
作者簡介:智能未來,始于Prompt!