標簽:視頻
百度又放大招!視覺生成模型 Hallo2 或將落地數字人等場景
作者 | 華衛 近日,百度聯合復旦大學等發布 Hallo2,一個可以生成長達數小時且分辨率為 4K 的人物動畫的視覺模型。Hallo2 目前已經在 GitHub 平臺開源,供全...
相機+AI視頻生成,港大CUBE框架入選ICIP,無需訓練實現可控視頻生成
CUBE團隊 投稿量子位 | 公眾號 QbitAI在這個信息爆炸的時代,如何讓AI生成的視頻更具創意,又符合特定需求? 來自香港大學的最新研究《基于事件、無需訓練的...
無需訓練即可創建數字人,字節PersonaTalk視頻口型編輯超SOTA
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
清華系AI視頻工具,用10天給《毒液》官方做了個片子
《毒液》AI短片主創團隊量子位 | 公眾號 QbitAI國產AI視頻大模型牽手國際頂尖IP! 最近票房單日冠軍漫威《毒液3》的水墨風宣傳片,竟然是用AI做的。就是下面...
機器人輕松模仿人類,還能泛化到不同任務和智能體!微軟新研究,學習人類和機器人統一動作表示
IGOR團隊 投稿量子位 | 公眾號 QbitAI讓機械臂模仿人類動作的新方法來了,不怕缺高質量機器人數據的那種。 微軟提出圖像目標表示(IGOR,Image-GOal Represen...
類Sora大模型入秋:訪問量驟降,被李彥宏潑冷水,“十年難見收益”
Sora還沒來,AI視頻賽道一夜入秋? 作者|李水青 編輯|心緣 當下,各路生成式AI工具落地如火如荼。 據全球知名數據機構SimilarWeb統計,2024年9月,穩居全球第...
搞定圖像+文本+視頻大一統!智源發布多模態世界模型Emu3:下一個token預測直通AGI
下一個token預測,通向多模態AGI。 OpenAI前首席科學家、聯合創始人Ilya Sutskever曾在多個場合表達觀點:只要能夠非常好的預測下一個token,就能幫助人類達...
智源 Emu3 證明多模態模型新范式:只需基于下一個 token 預測
只需基于下一個 token 預測,智源 Emu3 重新定義多模態模型。OpenAI前首席科學家、聯合創始人Ilya Sutskever曾在多個場合表達觀點:只要能夠非常好的預測下一...
Ilya預言成真,下一個token預測直達AGI!智源首發原生多模態世界模型Emu3,不用擴散
新智元報道編輯:編輯部 HYZ 【新智元導讀】最近,Ilya向黃仁勛描述「只要能預測下一個token,就能達到AGI」的視頻再次爆火全網,他的預言剛剛竟被證實?智源...
Ilya觀點得證!僅靠預測下一個token統一圖像文本視頻,智源發布原生多模態世界模型Emu3
夢晨 發自 凹非寺量子位 | 公眾號 QbitAIOpenAI前首席科學家、聯合創始人Ilya Sutskever曾在多個場合表達觀點: 只要能夠非常好的預測下一個token,就能幫助...
視頻、圖像、文本,只需基于下一個Token預測:智源Emu3發布,驗證多模態模型新范式
機器之心發布 機器之心編輯部OpenAI 前首席科學家、聯合創始人 Ilya Sutskever 曾在多個場合表達觀點:只要能夠非常好的預測下一個 token,就能幫助人類達到...
突破視頻多模態大模型瓶頸!「合成數據」立大功,項目已開源
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
視頻生成模型變身智能體:斯坦福Percy Liang等提出VideoAgent,竟能自我優化
機器之心報道 編輯:Panda現在正是「文本生視頻」賽道百花齊放的時代,而且其應用場景非常多,比如生成創意視頻內容、創建游戲場景、制作動畫和電影。甚至有...
萬字回顧YouTube的商業化之路:押注長視頻、廣告模式誤打誤撞、給創作者高分成
作為全球最大的中長視頻平臺,YouTube 今年的月活超過 27 億,做個比較的話,比抖音和 TikTok 加起來的月活還多,而收入方面,Youtube 去年實現了 315 億美元...
從威爾?史密斯鬼畜吃面到「Her」,這些幕后技術正在推動AI視頻時代的到來
機器之心原創 作者:張倩還記得「威爾?史密斯吃意大利面」的 AI 鬼畜視頻嗎?在這些視頻里,威爾?史密斯的面部表情、動作都非常夸張,還充滿了扭曲、變形。...