標簽:視頻

將Transformer用于擴散模型,AI 生成視頻達到照片級真實感

機器之心報道編輯:Panda在視頻生成場景中,用 Transformer 做擴散模型的去噪骨干已經被李飛飛等研究者證明行得通。這可算得上是 Transformer 在視頻生成領域...
閱讀原文

拳打Pika腳踢Gen-2!斯坦福李飛飛聯合谷歌,AI文生視頻大模型炸圈

文生視頻工具扎堆爆發,視頻的GPT時刻來了?作者|李水青編輯|漠影AI文生視頻賽道正呈現出爆發之勢!繼本月AI文生視頻工具Pika 1.0爆火出圈、Gen-2效果大升級...
閱讀原文

李飛飛谷歌破局之作!用Transformer生成逼真視頻,下一個Pika來了?

新智元報道編輯:Aeneas 潤【新智元導讀】今天,李飛飛攜斯坦福聯袂谷歌,用Transformer生成了逼真視頻,效果媲美Gen-2比肩Pika。2023年儼然已成AI視頻元年!...
閱讀原文

Runway官宣下場通用世界模型!解決視頻AI最大難題,竟靠AI模擬世界?

新智元報道編輯:編輯部【新智元導讀】Runway突然發布公告,宣稱要開發通用世界模型,解決AI視頻最大難題,未來要用AI模擬世界。最近AI視頻賽道的Pika 1.0大...
閱讀原文

阿里又整活兒:一張人臉一句話就能跳《擦玻璃》,服裝背景隨意換!

金磊 發自 凹非寺量子位 | 公眾號 QbitAI繼AnimateAnyone之后,阿里又一項“舞蹈整活兒”論文火了——這一次,只需一張臉部照片、一句話描述,就能讓你在任何地方...
閱讀原文

被高估的Pika,被低估的多模態AI|甲子光年

如何打通物理世界和數字世界之間的屏障?作者|蘇霍伊編輯|王博??多模態 AI 正處于爆發前夜。從 GPT-4V 的“驚艷亮相”,到 AI 視頻生成工具 Pika 1.0 的“火爆...
閱讀原文

阿里Animate Anyone跳舞火了,作者帶你解讀背后技術

從 GAN 開始,研究者一直在不斷深入了解將圖像進行動畫化以及進行姿態遷移的探索,然而,生成的圖像或視頻仍然存在局部失真、細節模糊、語義不一致和時間不穩...
閱讀原文

AI變鑒片大師,星際穿越都能看懂!賈佳亞團隊新作,多模態大模型挑戰超長3小時視頻

豐色 明敏 發自 凹非寺量子位 | 公眾號 QbitAI啥?AI都能自己看電影大片了?賈佳亞團隊最新研究成果,讓大模型直接學會了處理超長視頻。丟給它一部科幻大片《...
閱讀原文

谷歌承認Gemini視頻是“剪出來”的,想趕超GPT-4想瘋了

夕小瑤科技說 原創作者 | 付奶茶、王二狗大家好,我是奶茶。前天谷歌DeepMind新發布的Gemini模型刷屏了,大家是不是也和奶茶一樣被Gemini的效果震撼到了。覺...
閱讀原文

Pika 1.0首測秒殺Gen-2!網友搶先體驗電影級炸裂效果,背后技術細節首公開

新智元報道編輯:桃子【新智元導讀】Pika 1.0首測開啟了!網友搶先體驗,每個視頻都是經典。Pika 1.0正式上線后,拿到內測資格的網友們已經玩瘋了!有人用它...
閱讀原文

再反轉!谷歌Gemini又曝猛料,逐幀分析揭開復仇GPT-4的底牌

谷歌Gemini沒宣傳視頻里那么牛,但硬剛GPT-4夠了?作者|李水青編輯|云鵬在剛剛過去的24小時里,谷歌Gemini的一段演示視頻爆火全球。像機器人賈維斯一樣,谷歌...
閱讀原文

Gemini 解讀:原生多模態,反倒證明了文本對于大模型的重要性

谷歌在 12 月 6 日發布了 Gemini 語言大模型,并在 Bard 中上線了 Gemini Pro 版本。谷歌同時在官網發布了 Gemini 的詳細技術報告(),對于 Gemini 的訓練原...
閱讀原文

谷歌Gemini被曝視頻造假!多模態視頻竟是剪輯配音,擊敗GPT-4靠「作弊」?

新智元報道編輯:編輯部【新智元導讀】才一天,谷歌Gemini被質疑造假、夸大宣傳的議論聲淹沒了。多模態視頻是剪輯拼貼的,打敗GPT-4靠的是CoT@32,AlphaGo也...
閱讀原文

Gemini上線首日:用戶褒貶不一,演示被質疑「造假」,谷歌承認了

機器之心報道編輯:澤南、杜偉、陳萍又不求融資,怎么也給 demo 加美顏?「谷歌,這就有點尷尬了。」沒有想到,Gemini 上線頭一天,熱門評論會是這個樣子。本...
閱讀原文

口碑翻轉,Pika 1.0試用效果折服一大票人,直呼「最佳視頻生成器」

機器之心報道編輯:杜偉從陸續放出的 Pika 1.0 生成視頻來看,這次 Runway 真的迎來了一個強勁的競爭對手。上個月底,一個名為 的視頻生成 AI 模型在社交媒...
閱讀原文
1464748495054