AIGC動態歡迎閱讀
原標題:谷歌真·AI配音神器來了!自動看懂畫面、對齊音頻,能為任何視頻生成無數音頻
關鍵字:音頻,視頻,提示,畫面,模型
文章來源:智東西
內容字數:0字
內容摘要:
谷歌DeepMind發布最新AI視頻自動配音工具,AI視頻正式開啟有聲時代!
編譯|陳駿達
編輯|程茜
智東西6月18日消息,今日凌晨,谷歌DeepMind發布了一個名為V2A(Video-to-Audio)的系統,能根據畫面內容或者手動輸入的提示詞直接為視頻配音。它還可以為任何視頻輸入生成無限數量的音軌。
谷歌DeepMindV2A系統最大的特點就是無需人工輸入提示詞也可以為視頻配音。DeepMind在博客中稱V2A能依靠自己的視覺能力理解視頻中的像素。也就是說,V2A能看懂畫面,知道畫面里正在發生什么,應該出現什么聲音。
▲谷歌DeepMind發布的V2A Demo視頻
當然,V2A也能夠根據提示詞生成所需的音頻。使用者可以通過輸入“正面提示詞”來引導模型輸出所需的聲音,或輸入“負面提示詞”來引導其避免出現不需要的聲音,這給了使用者更大的控制權。
與其它AI音頻生成工具不同,V2A在生成音頻后無需人工對齊音頻視頻,而是可以直接自動將音頻與畫面對齊。
但谷歌DeepMind也承認,這一系統目前仍然存在很大的局限性。如果輸入的視頻質量不高,那么輸出的音頻質量也會出現明顯的下降。他們認為
原文鏈接:谷歌真·AI配音神器來了!自動看懂畫面、對齊音頻,能為任何視頻生成無數音頻
聯系作者
文章來源:智東西
作者微信:zhidxcom
作者簡介:智能產業新媒體!智東西專注報道人工智能主導的前沿技術發展,和技術應用帶來的千行百業產業升級。聚焦智能變革,服務產業升級。
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...