標簽：視頻

終局之戰(zhàn)！OpenAI Sora大佬專訪：AI視頻模型仍處在GPT-1時代

新智元報道編輯：alan 【新智元導(dǎo)讀】Sora一出，誰與爭鋒！近日，Sora團隊的三位負責(zé)人Aditya Ramesh、Tim Brooks和Bill Peebles接受了采訪，解讀了Sora在模...

閱讀原文

AIGC動態(tài)

2年前 (2024)

OpenAI Sora負責(zé)人最新萬字干貨深訪 · 完整版+視頻

來源：圖靈人工智能文：天空之城·城主在視頻生成領(lǐng)域，只有兩種模型：OpenAI Sora模型，以及其他不是Sora的模型。 Sora視頻生成的能力相比其他視頻生成模型...

閱讀原文

AIGC動態(tài)

2年前 (2024)

清華團隊國產(chǎn)“Sora”火了！畫面效果對標OpenAI，長度可達16秒，還能讀懂物理規(guī)律

允中發(fā)自凹非寺量子位 | 公眾號 QbitAISora席卷世界，也掀起了全球競逐AI視頻生成的熱潮。就在今天，國內(nèi)又有一支短片引發(fā)關(guān)注。視頻來自生數(shù)科技聯(lián)合清...

閱讀原文

AIGC動態(tài)

2年前 (2024)

“很接近Sora”，直擊清華團隊視頻大模型Vidu發(fā)布現(xiàn)場｜甲子光年

中國首個長時長、高一致性、高動態(tài)性視頻大模型。作者｜王博事先沒有一點聲張，今天上午，中國首個長時長、高一致性、高動態(tài)性視頻大模型Vidu就在中關(guān)村論壇...

閱讀原文

AIGC動態(tài)

2年前 (2024)

當前最強國產(chǎn)Sora！清華團隊突破16秒長視頻，懂多鏡頭語言，會模擬物理規(guī)律

機器之心原創(chuàng) 作者：張倩你說箱子里要裝滿鉆石，于是箱子被鉆石填滿，比實拍還要耀眼。這樣的技能，哪個劇組不喜歡？這是前段時間 Adobe 旗下的視頻剪輯軟件 ...

閱讀原文

AIGC動態(tài)

2年前 (2024)

今日arXiv最熱大模型論文：大模型也來看球，還能判斷是否犯規(guī)

夕小瑤科技說原創(chuàng)作者 | 謝年年在足球世界，裁判的哨聲可謂“千金難買”，因為它能直接決定俱樂部的錢包是鼓是癟。但球場變化莫測，非常考驗裁判的水平。 2022...

閱讀原文

AIGC動態(tài)

2年前 (2024)

LLaMA 3：大模型之戰(zhàn)的新序幕

作者 | 符堯 OneFlow編譯翻譯｜楊婷、宛子琳、張雪聃本文要點概覽：文本數(shù)據(jù)的擴展可能已經(jīng)達到了極限，因為易于獲取的網(wǎng)絡(luò)文本資源（如Common Crawl、Git...

閱讀原文

AIGC動態(tài)

2年前 (2024)

Open-Sora 全面開源升級：支持單鏡頭16s視頻生成和720p分辨率

Open-Sora 在開源社區(qū)悄悄更新了，現(xiàn)在支持單鏡頭長達16秒的視頻生成，分辨率最高可達720p，并且可以處理任何寬高比的文本到圖像、文本到視頻、圖像到視頻、...

閱讀原文

AIGC動態(tài)

2年前 (2024)

Open-Sora全面開源升級：支持16s視頻生成和720p分辨率

機器之心發(fā)布機器之心編輯部Open-Sora 在開源社區(qū)悄悄更新了，現(xiàn)在單鏡頭支持長達16秒的視頻生成，分辨率最高可達720p，并且可以處理任何寬高比的文本到圖像...

閱讀原文

AIGC動態(tài)

2年前 (2024)

視頻生成技術(shù)與應(yīng)用 AI 技術(shù)論壇圓滿收官

致力于助力企業(yè)和廣大從業(yè)者掌握 AI 視頻生成技術(shù)前沿，把握時代機遇的“視頻生成技術(shù)與應(yīng)用 — Sora 時代”——機器之心 AI 技術(shù)論壇日前圓滿收官。活動當天，北...

閱讀原文

AIGC動態(tài)

2年前 (2024)

Open-Sora 全面開源升級：支持 16s 視頻生成和 720p 分辨率

最近，AI 科技評論發(fā)現(xiàn)，國產(chǎn)視頻生成模型 Open-Sora 在開源社區(qū)悄悄更新了！現(xiàn)在支持長達16秒的視頻生成，分辨率最高可達720p，并且可以處理任何寬高比的文...

閱讀原文

AIGC動態(tài)

2年前 (2024)

Meta 眼鏡支持多模態(tài) Llama 3，實時翻譯、物體識別，AI 眼鏡的機會來了！

來自 Meta 官方消息，Meta 自家的雷朋智能眼鏡，開始支持多模態(tài)版的 Llama 3 了！要知道，Llama 3 的開源版本還沒支持多模態(tài)。戴上這副智能眼鏡，外出旅行坐...

閱讀原文

AIGC動態(tài)

2年前 (2024)

一張照片+音頻=超逼真數(shù)字人視頻！VASA-1模型拉開「實時交互」大幕

新智元報道編輯：LRS 【新智元導(dǎo)讀】僅需一張照片加一段音頻，即可生成具有精確唇音同步、逼真面部行為和自然頭部運動的超逼真說話面部視頻，并且生成速度快...

閱讀原文

AIGC動態(tài)

2年前 (2024)

在線教程丨劉強東數(shù)字人首秀交易額破5千萬！用GeneFace++ 生成實時說話數(shù)字人

作者：十九編輯：李寶珠，三羊封面圖來源：GeneFace++ GeneFace++：輸入一段語音，就能生成目標人臉的說話視頻。近日，京東創(chuàng)始人劉強東化身「采銷東哥 AI ...

閱讀原文

AIGC動態(tài)

2年前 (2024)

微軟「詐騙屆」王牌框架，真到可怕！一張照片+音頻即可生成數(shù)字人

新智元報道編輯：LRS 【新智元導(dǎo)讀】想要做出一段能夠「以假亂真的人物說話視頻」的門檻到底低到什么程度了？僅需一張照片加一段音頻，就能生成一段堪稱真實...

閱讀原文

AIGC動態(tài)

2年前 (2024)

1…24 252627 28…54