標簽:視頻
終局之戰!OpenAI Sora大佬專訪:AI視頻模型仍處在GPT-1時代
新智元報道編輯:alan 【新智元導讀】Sora一出,誰與爭鋒!近日,Sora團隊的三位負責人Aditya Ramesh、Tim Brooks和Bill Peebles接受了采訪,解讀了Sora在模...
OpenAI Sora負責人最新萬字干貨深訪 · 完整版+視頻
來源:圖靈人工智能 文:天空之城·城主 在視頻生成領域,只有兩種模型:OpenAI Sora模型,以及其他不是Sora的模型。 Sora視頻生成的能力相比其他視頻生成模型...
清華團隊國產“Sora”火了!畫面效果對標OpenAI,長度可達16秒,還能讀懂物理規律
允中 發自 凹非寺量子位 | 公眾號 QbitAISora席卷世界,也掀起了全球競逐AI視頻生成的熱潮。 就在今天,國內又有一支短片引發關注。 視頻來自生數科技聯合清...
“很接近Sora”,直擊清華團隊視頻大模型Vidu發布現場|甲子光年
中國首個長時長、高一致性、高動態性視頻大模型。作者|王博 事先沒有一點聲張,今天上午,中國首個長時長、高一致性、高動態性視頻大模型Vidu就在中關村論壇...
當前最強國產Sora!清華團隊突破16秒長視頻,懂多鏡頭語言,會模擬物理規律
機器之心原創 作者:張倩你說箱子里要裝滿鉆石,于是箱子被鉆石填滿,比實拍還要耀眼。這樣的技能,哪個劇組不喜歡?這是前段時間 Adobe 旗下的視頻剪輯軟件 ...
今日arXiv最熱大模型論文:大模型也來看球,還能判斷是否犯規
夕小瑤科技說 原創作者 | 謝年年在足球世界,裁判的哨聲可謂“千金難買”,因為它能直接決定俱樂部的錢包是鼓是癟。但球場變化莫測,非常考驗裁判的水平。 2022...
LLaMA 3:大模型之戰的新序幕
作者 | 符堯 OneFlow編譯 翻譯|楊婷、宛子琳、張雪聃 本文要點概覽: 文本數據的擴展可能已經達到了極限,因為易于獲取的網絡文本資源(如Common Crawl、Git...
Open-Sora 全面開源升級:支持單鏡頭16s視頻生成和720p分辨率
Open-Sora 在開源社區悄悄更新了,現在支持單鏡頭長達16秒的視頻生成,分辨率最高可達720p,并且可以處理任何寬高比的文本到圖像、文本到視頻、圖像到視頻、...
Open-Sora全面開源升級:支持16s視頻生成和720p分辨率
機器之心發布 機器之心編輯部Open-Sora 在開源社區悄悄更新了,現在單鏡頭支持長達16秒的視頻生成,分辨率最高可達720p,并且可以處理任何寬高比的文本到圖像...
視頻生成技術與應用 AI 技術論壇圓滿收官
致力于助力企業和廣大從業者掌握 AI 視頻生成技術前沿,把握時代機遇的“視頻生成技術與應用 — Sora 時代”——機器之心 AI 技術論壇日前圓滿收官。 活動當天,北...
Open-Sora 全面開源升級:支持 16s 視頻生成和 720p 分辨率
最近,AI 科技評論發現,國產視頻生成模型 Open-Sora 在開源社區悄悄更新了! 現在支持長達16秒的視頻生成,分辨率最高可達720p,并且可以處理任何寬高比的文...
Meta 眼鏡支持多模態 Llama 3,實時翻譯、物體識別,AI 眼鏡的機會來了!
來自 Meta 官方消息,Meta 自家的雷朋智能眼鏡,開始支持多模態版的 Llama 3 了!要知道,Llama 3 的開源版本還沒支持多模態。 戴上這副智能眼鏡,外出旅行坐...
一張照片+音頻=超逼真數字人視頻!VASA-1模型拉開「實時交互」大幕
新智元報道編輯:LRS 【新智元導讀】僅需一張照片加一段音頻,即可生成具有精確唇音同步、逼真面部行為和自然頭部運動的超逼真說話面部視頻,并且生成速度快...
在線教程丨劉強東數字人首秀交易額破5千萬!用GeneFace++ 生成實時說話數字人
作者:十九 編輯:李寶珠,三羊 封面圖來源:GeneFace++ GeneFace++:輸入一段語音,就能生成目標人臉的說話視頻。近日,京東創始人劉強東化身「采銷東哥 AI ...
微軟「詐騙屆」王牌框架,真到可怕!一張照片+音頻即可生成數字人
新智元報道編輯:LRS 【新智元導讀】想要做出一段能夠「以假亂真的人物說話視頻」的門檻到底低到什么程度了?僅需一張照片加一段音頻,就能生成一段堪稱真實...