字節(jié)版 Sora 來了!兩款視頻模型驚艷亮相,我扒出了它強大的秘密
AIGC動態(tài)歡迎閱讀
原標(biāo)題:字節(jié)版 Sora 來了!兩款視頻模型驚艷亮相,我扒出了它強大的秘密
關(guān)鍵字:視頻,華為,字節(jié)跳動,模型,豆包
文章來源:愛范兒
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
視頻模型
又一新玩家沒想到,字節(jié)版 Sora 就這么水靈靈地就來了。
昨日,字節(jié)跳動旗下火山引擎在深圳舉辦 AI 創(chuàng)新巡展,一舉推出了豆包視頻生成-PixelDance、豆包視頻生成-Seaweed 兩款大模型。
簡單總結(jié)豆包視頻模型的特點:
支持文生/圖生視頻,時長可達 10s精準(zhǔn)的語義理解,多動作多主體交互一致性切鏡強大動態(tài)與酷炫運鏡高保真高美感,多風(fēng)格多尺寸話不多說,先來感受一下官方給出的演示 demo。
相比大部分視頻生成模型,豆包視頻生成模型可以遵從更復(fù)雜的 prompt,指哪兒打哪兒,生成更復(fù)雜的動作。
多人多動作視頻生成,動態(tài)真實自然
全新設(shè)計的擴散模型訓(xùn)練方法,成功攻克了多鏡頭切換時難以保持一致性的困擾,能在 10 秒內(nèi)講述一個完整的故事。
多個鏡頭切換時,也能保持主體、風(fēng)格、氛圍和邏輯的一致性,真·導(dǎo)演。
主角掏鑰匙開門、取東西、關(guān)門一氣呵成,且畫面細(xì)節(jié)也不掉鏈子。
潛水員畫面前后變焦的真實細(xì)膩,告別了傳統(tǒng)的 PPT 動畫,帶來真實世界的體驗。
深度優(yōu)化的 Transformer 結(jié)構(gòu)也大幅提升了視頻生成的泛化能力,支持包括黑白、3D 動畫、國畫等多種風(fēng)格,包含
原文鏈接:字節(jié)版 Sora 來了!兩款視頻模型驚艷亮相,我扒出了它強大的秘密
聯(lián)系作者
文章來源:愛范兒
作者微信:
作者簡介:
相關(guān)文章
