標簽:音頻

WPS接入DeepSeek,秒變辦公神器!

WPS 大家經常用來日常寫作,雖然本身提供了AI功能,但可惜需要會員,本文教你三分鐘接入最火的DeepSeek,讓WPS秒變辦公神器。 DeepSeek API申請地址:http:/...
閱讀原文

AI賺錢副業~AI生成影視解說,半個月漲粉變現3.5W+!

這兩年大家都在感嘆生活不易,然而我想說的是,機會還是有的,但問題不在于有沒有,而在于你是否能夠認準機會,然后抓住它。 接觸過很多咨詢項目的人,發現...

微信公眾號悄悄上線AI音色克隆,微信的一小步,卻是AI的一大步。

大數據文摘受權轉載自數字生命卡茲克 作者:卡茲克 這篇文章,可能是我有史以來最特殊的一篇文章。 因為當你點開右上角的三個點,點擊聽全文的時候。 可能你...
閱讀原文

今天,智譜「新清影」上線,率先進入有聲視頻生成時代!還要繼續開源寵粉

夕小瑤科技說 原創作者 | 夕小瑤編輯部來,你先把手機音量打開,然后去“聽”下面一段視頻: 你是不是一臉懵逼?不知道我想表達什么? 視頻是AI生成的并不奇怪...
閱讀原文

百度又放大招!視覺生成模型 Hallo2 或將落地數字人等場景

作者 | 華衛 近日,百度聯合復旦大學等發布 Hallo2,一個可以生成長達數小時且分辨率為 4K 的人物動畫的視覺模型。Hallo2 目前已經在 GitHub 平臺開源,供全...
閱讀原文

剛剛,我們感受了一波最「像人」的國產AI,模型還是開源的

機器之心原創 作者:杜偉、蛋醬今年 5 月,OpenAI 首次展示了 GPT-4o 的語音功能,無論是對話的響應速度還是與真人聲音的相似度,都頗為驚艷。特別是它允許用...
閱讀原文

NotebookLM核心負責人訪談: 項目不到 10個人,體驗驚艷全球,但它還只是個技術demo

難以置信,在 2024 年,Google 還能推出全行業叫好的驚艷項目——不是商業化產品,而是在設計、體驗上讓行業學到一課的小項目。 在上周的 OpenAI Dev Day 上,S...
閱讀原文

谷歌這款AI應用憑什么在一年后爆紅?大神卡帕西:或是下一個ChatGPT

來源:AI前線 編譯:核子可樂、Tina 它實際是一款可由最終用戶定制的 RAG 產品。或是下一個 ChatGPT?最近幾天,人們似乎對一款已經不新鮮的 AI 助手 Noteboo...
閱讀原文

Meta又給OpenAI一記重擊,視頻生成Movie Gen震撼登場,甚至可以配音、編輯

機器之心報道 編輯:Panda、大盤雞視頻生成領域真是越來越卷且越來越邁向實用性! 在 OpenAI Sora 難產的時候,Meta 首次公開展示了自家的「用于媒體的突破性...
閱讀原文

大神卡帕西安利爆火AI應用,稱「或是下一個ChatGPT」

衡宇 發自 凹非寺量子位 | 公眾號 QbitAI大神卡帕西墻裂推薦! 甚至預言這個AI應用,有可能開啟「和ChatGPT一樣大的機會」。 它就是來自谷歌的實驗性AI產品,...
閱讀原文

三只羊盧總的錄音AI到底能不能做出來?我的答案是:當然能。

大數據文摘受權轉載自數字生命卡茲克 作者:卡茲克 今天凌晨,N多人給我發了一張圖,說警方通報了,問我到底怎么看三只羊錄音是不是AI這事。 還有朋友跟我說...
閱讀原文

150萬條多語種音頻數據!浙大清華發布語音偽造檢測框架SafeEar,兼顧隱私保護|CCS 2024

新智元報道編輯:LRST 【新智元導讀】SafeEar是一種內容隱私保護的語音偽造檢測方法,其核心是設計基于神經音頻編解碼器的解耦模型,分離語音聲學與語義信息...
閱讀原文

開源版GPT-4o來了,AI大神Karpathy盛贊!67頁技術報告全公開

新智元報道編輯:alan 【新智元導讀】兩個多月前那個對標GPT-4o的端到端語音模型,終于開源了。大神Karpathy體驗之后表示:nice!前段時間技驚四座、劍指GPT-...
閱讀原文

開源版《Her》來了,技術報告已公開!大神Karpathy:它很有個性

一水 發自 凹非寺量子位 | 公眾號 QbitAI大神Karpathy鼎力推薦,開源版「Her」Moshi再引關注! (Moshi)的性格非常有趣,它會突然斷斷續續,有時會無緣無故...
閱讀原文

字節音樂大模型炸場!Seed-Music發布,支持一鍵生成高質量歌曲、片段編輯等

機器之心發布 機器之心編輯部高質量音樂生成、高靈活音樂編輯,Seed-Music 再次打開了 AI 音樂創作的天花板。放假期間,本 i 人又領教了被 e 人支配的恐懼。 ...
閱讀原文

字節AI版小李子一開口:黃風嶺,八百里

叨樂 發自 凹非寺量子位 | 公眾號 QbitAI字節和浙大聯合研發的項目Loopy火了! 只需一幀圖像,一段音頻,就能生成一段非常自然的視頻! 研究團隊還放出了Loop...
閱讀原文

音頻驅動人像視頻模型:字節Loopy、CyberHost研究成果揭秘

機器之心發布 機器之心編輯部近期,來自字節跳動的視頻生成模型 Loopy,一經發布就在 X 上引起了廣泛的討論。Loopy 可以僅僅通過一張圖片和一段音頻生成逼真...
閱讀原文
1236