標簽:視頻
終局之戰(zhàn)!OpenAI Sora大佬專訪:AI視頻模型仍處在GPT-1時代
新智元報道編輯:alan 【新智元導(dǎo)讀】Sora一出,誰與爭鋒!近日,Sora團隊的三位負責(zé)人Aditya Ramesh、Tim Brooks和Bill Peebles接受了采訪,解讀了Sora在模...
OpenAI Sora負責(zé)人最新萬字干貨深訪 · 完整版+視頻
來源:圖靈人工智能 文:天空之城·城主 在視頻生成領(lǐng)域,只有兩種模型:OpenAI Sora模型,以及其他不是Sora的模型。 Sora視頻生成的能力相比其他視頻生成模型...
清華團隊國產(chǎn)“Sora”火了!畫面效果對標OpenAI,長度可達16秒,還能讀懂物理規(guī)律
允中 發(fā)自 凹非寺量子位 | 公眾號 QbitAISora席卷世界,也掀起了全球競逐AI視頻生成的熱潮。 就在今天,國內(nèi)又有一支短片引發(fā)關(guān)注。 視頻來自生數(shù)科技聯(lián)合清...
“很接近Sora”,直擊清華團隊視頻大模型Vidu發(fā)布現(xiàn)場|甲子光年
中國首個長時長、高一致性、高動態(tài)性視頻大模型。作者|王博 事先沒有一點聲張,今天上午,中國首個長時長、高一致性、高動態(tài)性視頻大模型Vidu就在中關(guān)村論壇...
當前最強國產(chǎn)Sora!清華團隊突破16秒長視頻,懂多鏡頭語言,會模擬物理規(guī)律
機器之心原創(chuàng) 作者:張倩你說箱子里要裝滿鉆石,于是箱子被鉆石填滿,比實拍還要耀眼。這樣的技能,哪個劇組不喜歡?這是前段時間 Adobe 旗下的視頻剪輯軟件 ...
今日arXiv最熱大模型論文:大模型也來看球,還能判斷是否犯規(guī)
夕小瑤科技說 原創(chuàng)作者 | 謝年年在足球世界,裁判的哨聲可謂“千金難買”,因為它能直接決定俱樂部的錢包是鼓是癟。但球場變化莫測,非常考驗裁判的水平。 2022...
LLaMA 3:大模型之戰(zhàn)的新序幕
作者 | 符堯 OneFlow編譯 翻譯|楊婷、宛子琳、張雪聃 本文要點概覽: 文本數(shù)據(jù)的擴展可能已經(jīng)達到了極限,因為易于獲取的網(wǎng)絡(luò)文本資源(如Common Crawl、Git...
Open-Sora 全面開源升級:支持單鏡頭16s視頻生成和720p分辨率
Open-Sora 在開源社區(qū)悄悄更新了,現(xiàn)在支持單鏡頭長達16秒的視頻生成,分辨率最高可達720p,并且可以處理任何寬高比的文本到圖像、文本到視頻、圖像到視頻、...
Open-Sora全面開源升級:支持16s視頻生成和720p分辨率
機器之心發(fā)布 機器之心編輯部Open-Sora 在開源社區(qū)悄悄更新了,現(xiàn)在單鏡頭支持長達16秒的視頻生成,分辨率最高可達720p,并且可以處理任何寬高比的文本到圖像...
視頻生成技術(shù)與應(yīng)用 AI 技術(shù)論壇圓滿收官
致力于助力企業(yè)和廣大從業(yè)者掌握 AI 視頻生成技術(shù)前沿,把握時代機遇的“視頻生成技術(shù)與應(yīng)用 — Sora 時代”——機器之心 AI 技術(shù)論壇日前圓滿收官。 活動當天,北...
Open-Sora 全面開源升級:支持 16s 視頻生成和 720p 分辨率
最近,AI 科技評論發(fā)現(xiàn),國產(chǎn)視頻生成模型 Open-Sora 在開源社區(qū)悄悄更新了! 現(xiàn)在支持長達16秒的視頻生成,分辨率最高可達720p,并且可以處理任何寬高比的文...
Meta 眼鏡支持多模態(tài) Llama 3,實時翻譯、物體識別,AI 眼鏡的機會來了!
來自 Meta 官方消息,Meta 自家的雷朋智能眼鏡,開始支持多模態(tài)版的 Llama 3 了!要知道,Llama 3 的開源版本還沒支持多模態(tài)。 戴上這副智能眼鏡,外出旅行坐...
一張照片+音頻=超逼真數(shù)字人視頻!VASA-1模型拉開「實時交互」大幕
新智元報道編輯:LRS 【新智元導(dǎo)讀】僅需一張照片加一段音頻,即可生成具有精確唇音同步、逼真面部行為和自然頭部運動的超逼真說話面部視頻,并且生成速度快...
在線教程丨劉強東數(shù)字人首秀交易額破5千萬!用GeneFace++ 生成實時說話數(shù)字人
作者:十九 編輯:李寶珠,三羊 封面圖來源:GeneFace++ GeneFace++:輸入一段語音,就能生成目標人臉的說話視頻。近日,京東創(chuàng)始人劉強東化身「采銷東哥 AI ...
微軟「詐騙屆」王牌框架,真到可怕!一張照片+音頻即可生成數(shù)字人
新智元報道編輯:LRS 【新智元導(dǎo)讀】想要做出一段能夠「以假亂真的人物說話視頻」的門檻到底低到什么程度了?僅需一張照片加一段音頻,就能生成一段堪稱真實...
粵公網(wǎng)安備 44011502001135號