標簽：音頻

8人半年肝出開源版GPT-4o，0延遲演示全網沸騰！背后技術揭秘，人人免費用

新智元報道編輯：桃子喬楊【新智元導讀】GPT-4o或許還得等到今年秋季才對外開放。不過，由法國8人團隊打造的原生多模態Moshi，已經實現了接近GPT-4o的水平...

閱讀原文

AIGC動態

1年前 (2024)

谷歌真·AI配音神器來了！自動看懂畫面、對齊音頻，能為任何視頻生成無數音頻

谷歌DeepMind發布最新AI視頻自動配音工具，AI視頻正式開啟有聲時代！編譯|陳駿達編輯|程茜智東西6月18日消息，今日凌晨，谷歌DeepMind發布了一個名為V2A（...

閱讀原文

AIGC動態

1年前 (2024)

文生視頻又開始卷了！Runway、Luma、DeepMind 都有重磅更新

引領了 2024 年文生視頻熱潮的 Sora，至今沒有正式對外開放使用，而其他的文生視頻產品，在這半年內開始了瘋狂進化。上周，Luma AI 發布的 Dream Machine 讓...

閱讀原文

AIGC動態

1年前 (2024)

Google DeepMind 最新研究：為AI視頻生成創建逼真的背景聲音

來源：學術頭條自 Sora 發布以來，國內外各大科技公司和研究機構都在競相推出“文生視頻”大模型，比如生數科技的 Vidu、快手的可靈和 Runway 昨天才發布的 Ge...

閱讀原文

AIGC動態

1年前 (2024)

殺瘋了！谷歌卷視頻到語音，逼真音效讓AI視頻告別無聲！

機器之心報道編輯：楊文AI圈這遍地開花的大好局面，讓吃瓜群眾們甚是驚喜。這幾天，大洋彼岸殺瘋了！ Luma 的熱乎勁兒還沒過去，昨晚 Runway 就甩出一個王...

閱讀原文

AIGC動態

1年前 (2024)

霉霉開口唱碧昂絲的歌，又是AI！口型不出戲，五官姿態也自然，復旦百度等出品｜GitHub攬星1k+

西風發自凹非寺量子位 | 公眾號 QbitAI一張人像、一段音頻參考，就能讓霉霉在你面前唱碧昂絲的《Halo》。一種名為Hallo的研究火了，GitHub已攬星1k+。話...

閱讀原文

AIGC動態

1年前 (2024)

37項SOTA！全模態預訓練范式MiCo：理解任何模態并學習通用表示｜港中文&中科院

MiCo團隊投稿量子位 | 公眾號 QbitAIGPT-4o掀起一股全模態（Omni-modal）熱潮，去年的熱詞多模態仿佛已經不夠看了。要構建全模態智能，意味著能夠理解任何...

閱讀原文

AIGC動態

1年前 (2024)

GPT-4o僅排第二！北大港大等6所高校聯手，發布權威多模態大模型榜單！

夕小瑤科技說原創作者 | 謝年年多模態大模型視頻分析能力榜單出爐： Gemini 1.5 Pro最強，GPT-4o僅排第二？曾經紅極一時的GPT-4V屈居第三。最近，北大港大...

閱讀原文

AIGC動態

1年前 (2024)

Stability AI開源47秒音頻生成模型，蟲鳴鳥叫、搖滾、鼓點都能生成

機器之心報道編輯：蛋醬、小舟音頻生成領域又有好消息：剛剛，Stability AI 宣布推出開放模型 Stable Audio Open，該模型能夠生成高質量的音頻數據。項目地...

閱讀原文

AIGC動態

1年前 (2024)

免費GPT-4o來襲，音頻視覺文本實現「大一統」

OpenAI「魔法」降臨。作者 | 賴文昕今天凌晨，即北京時間5月14日1點整，OpenAI 召開了首場春季發布會，CTO Mira Murati 在臺上和團隊用短短不到30分鐘的時間...

閱讀原文

AIGC動態

2年前 (2024)

OpenAI顛覆世界：GPT-4o完全免費，實時語音視頻交互震撼全場，直接進入科幻時代

機器之心報道機器之心編輯部ChatGPT 問世才 17 個月，OpenAI 就拿出了科幻電影里的超級 AI，而且完全免費，人人可用。太震撼了！當各家科技公司還在追趕大...

閱讀原文

AIGC動態

2年前 (2024)

DeepMusic劉曉光：深度解讀AIGC音樂創作技術原理，明年實現一鍵生成自唱歌曲丨GenAICon 2024

深度解讀AIGC音樂創作技術原理，明年實現30秒人聲生成自唱歌曲。 2024中國生成式AI大會于4月18-19日在北京舉行，在大會第二天的主會場AIGC應用專場上，DeepMu...

閱讀原文

AIGC動態

2年前 (2024)

一張照片+音頻=超逼真數字人視頻！VASA-1模型拉開「實時交互」大幕

新智元報道編輯：LRS 【新智元導讀】僅需一張照片加一段音頻，即可生成具有精確唇音同步、逼真面部行為和自然頭部運動的超逼真說話面部視頻，并且生成速度快...

閱讀原文

AIGC動態

2年前 (2024)

在線教程丨劉強東數字人首秀交易額破5千萬！用GeneFace++ 生成實時說話數字人

作者：十九編輯：李寶珠，三羊封面圖來源：GeneFace++ GeneFace++：輸入一段語音，就能生成目標人臉的說話視頻。近日，京東創始人劉強東化身「采銷東哥 AI ...

閱讀原文

AIGC動態

2年前 (2024)

微軟「詐騙屆」王牌框架，真到可怕！一張照片+音頻即可生成數字人

新智元報道編輯：LRS 【新智元導讀】想要做出一段能夠「以假亂真的人物說話視頻」的門檻到底低到什么程度了？僅需一張照片加一段音頻，就能生成一段堪稱真實...

閱讀原文

AIGC動態

2年前 (2024)

1 234 5 6