標簽：音頻

谷歌VideoPoet負責人蔣路跳槽TikTok！對標Sora，AI視頻模型大戰在即

新智元報道編輯：編輯部【新智元導讀】谷歌Research Lead，負責VideoPoet項目的蔣路，即將加入TikTok，負責視頻生成AI的開發。谷歌VideoPoet項目Research Le...

閱讀原文

AIGC動態

2年前 (2024)

給 Sora 視頻配音，ElevenLabs 推出 AI 音效生成功能，離 AI 生成電影又近了一步！

Sora 之后的新突破來了！ AI 語音克隆初創公司 ElevenLabs 宣布即將上線 AI Sound Effects 功能，可以讓用戶輸入 Prompt 自動生成聲音。在他們發布的演示短片...

閱讀原文

AIGC動態

2年前 (2024)

AI配音版Sora視頻刷屏！絕真音效打破「無聲電影」，或顛覆萬億美元產業

新智元報道編輯：桃子好困【新智元導讀】Sora突破之后的突破又來了！語音初創公司ElevenLabs放大招，直接用AI給Sora經典視頻完成了配音。網友驚呼離AI完全...

閱讀原文

AIGC動態

2年前 (2024)

音頻秒生全身虛擬人像，AI完美驅動面部肢體動作！UC伯克利Meta提出Audio2Photoreal

新智元報道編輯：拉燕【新智元導讀】最近，來自Meta和UC伯克利的研究人員，發布了一種最新的音頻到人像模型。操作簡單，輸出極致逼真。就在最近，Meta和UC伯...

閱讀原文

AIGC動態

2年前 (2024)

AI反詐！Deepfake音視頻檢測技術亮相CES，準確率超90%

西風發自凹非寺量子位 | 公眾號 QbitAI離大譜，一個標有美國消費者新聞與商業頻道CNBC logo的視頻稱： “每個歐洲人靠ChatGPT，每周能賺3到4千歐元。” “投資...

閱讀原文

AIGC動態

2年前 (2024)

字節讓達芬奇和蒙娜麗莎“隔空吵架”，只需一張圖、一段音頻、一個情感片段

允中發自凹非寺量子位 | 公眾號 QbitAIAIGC在視頻生成領域展現出非凡的潛力。近期，字節跳動智能創作團隊和得克薩斯大學達拉斯分校又提出了一項名為DREAM-...

閱讀原文

AIGC動態

2年前 (2024)

GPT-5前瞻！艾倫人工智能研究所發布最強多模態模型，預測GPT-5新能力

新智元報道編輯：alan 【新智元導讀】近日，艾倫人工智能研究所發布了Unified-IO 2，——第一代Unified-IO曾預測了GPT-4等模型的能力，所以我們可以從新一代的...

閱讀原文

AIGC動態

2年前 (2024)

一句話精準視頻片段定位！清華新方法拿下SOTA｜已開源

陳厚倫投稿量子位 | 公眾號 QbitAI只需一句話描述，就能在一大段視頻中定位到對應片段！比如描述“一個人一邊下樓梯一邊喝水”，通過視頻畫面和腳步聲的匹配...

閱讀原文

AIGC動態

2年前 (2024)

蘋果押注的這個新技術，可能改變你聽歌的方式

空間音頻 vs 3D 電影我一直在等待音樂領域里那個能改變游戲規則的東西。 2021 年，蘋果高級副總裁 Eddy Cue 在接受《滾石》雜志采訪時表示，「空間音頻」就是...

閱讀原文

AIGC動態

2年前 (2023)

谷歌推出視頻生成大型語言模型VideoPoet

點擊上方藍字關注我們“Google推出VideoPoet，一款生成式AI系統，通過文本等輸入創建和編輯視頻。與競爭模型不同，VideoPoet整合多項功能于單一模型，包括文本...

閱讀原文

AIGC動態

2年前 (2023)

視頻生成可以無限長？谷歌VideoPoet大模型上線，網友：性技術

機器之心報道機器之心編輯部蒙娜麗莎打哈欠，小雞學會舉鐵……谷歌VideoPoet大模型表現很亮眼。2023 年底，科技公司都在沖擊生成式 AI 的最后一個關卡 —— 視頻...

閱讀原文

AIGC動態

2年前 (2023)

霉霉演唱《稻香》，國內團隊的Amphion音頻生成火了

機器之心專欄機器之心編輯部香港中文大學（深圳）數據科學學院武執政副教授團隊聯合上海人工智能實驗室 OpenMMLab 團隊開源了綜合音頻生成項目 Amphion（安...

閱讀原文

AIGC動態

2年前 (2023)

谷歌10秒視頻生成模型破世界記錄！LLM終結擴散模型，效果碾壓頂流Gen-2

新智元報道編輯：編輯部【新智元導讀】谷歌全新視頻生成模型VideoPoet再次引領世界！十秒超長視頻生成效果碾壓Gen-2，還可進行音頻生成，風格轉化。AI視頻生...

閱讀原文

AIGC動態

2年前 (2023)

走在GPT 4.5前面？3D、視頻直接扔進對話框，大模型掌握跨模態推理

機器之心報道編輯：Panda W最近，有人在社交媒體上發布了一張有關 GPT4.5 更新的截圖。圖中內容顯示，和 GPT 系列之前推出的模型相比，GPT4.5 最大的驚喜可能...

閱讀原文

AIGC動態

2年前 (2023)

一張照片、一段聲音秒生超逼真視頻！南大等提出全新框架，口型動作精準還原

新智元報道編輯：潤好困【新智元導讀】最近，來自南大等機構的研究人員開發了一個通用的框架，用一段音頻就能讓照片上的頭像講多國語言。不論是頭部動作還是...

閱讀原文

AIGC動態

2年前 (2023)

1…3 456