標簽:音頻

WPS接入DeepSeek,秒變辦公神器!

WPS 大家經(jīng)常用來日常寫作,雖然本身提供了AI功能,但可惜需要會員,本文教你三分鐘接入最火的DeepSeek,讓WPS秒變辦公神器。 DeepSeek API申請地址:http:/...
閱讀原文

AI賺錢副業(yè)~AI生成影視解說,半個月漲粉變現(xiàn)3.5W+!

這兩年大家都在感嘆生活不易,然而我想說的是,機會還是有的,但問題不在于有沒有,而在于你是否能夠認準機會,然后抓住它。 接觸過很多咨詢項目的人,發(fā)現(xiàn)...

微信公眾號悄悄上線AI音色克隆,微信的一小步,卻是AI的一大步。

大數(shù)據(jù)文摘受權(quán)轉(zhuǎn)載自數(shù)字生命卡茲克 作者:卡茲克 這篇文章,可能是我有史以來最特殊的一篇文章。 因為當你點開右上角的三個點,點擊聽全文的時候。 可能你...
閱讀原文

今天,智譜「新清影」上線,率先進入有聲視頻生成時代!還要繼續(xù)開源寵粉

夕小瑤科技說 原創(chuàng)作者 | 夕小瑤編輯部來,你先把手機音量打開,然后去“聽”下面一段視頻: 你是不是一臉懵逼?不知道我想表達什么? 視頻是AI生成的并不奇怪...
閱讀原文

百度又放大招!視覺生成模型 Hallo2 或?qū)⒙涞財?shù)字人等場景

作者 | 華衛(wèi) 近日,百度聯(lián)合復(fù)旦大學等發(fā)布 Hallo2,一個可以生成長達數(shù)小時且分辨率為 4K 的人物動畫的視覺模型。Hallo2 目前已經(jīng)在 GitHub 平臺開源,供全...
閱讀原文

剛剛,我們感受了一波最「像人」的國產(chǎn)AI,模型還是開源的

機器之心原創(chuàng) 作者:杜偉、蛋醬今年 5 月,OpenAI 首次展示了 GPT-4o 的語音功能,無論是對話的響應(yīng)速度還是與真人聲音的相似度,都頗為驚艷。特別是它允許用...
閱讀原文

NotebookLM核心負責人訪談: 項目不到 10個人,體驗驚艷全球,但它還只是個技術(shù)demo

難以置信,在 2024 年,Google 還能推出全行業(yè)叫好的驚艷項目——不是商業(yè)化產(chǎn)品,而是在設(shè)計、體驗上讓行業(yè)學到一課的小項目。 在上周的 OpenAI Dev Day 上,S...
閱讀原文

谷歌這款A(yù)I應(yīng)用憑什么在一年后爆紅?大神卡帕西:或是下一個ChatGPT

來源:AI前線 編譯:核子可樂、Tina 它實際是一款可由最終用戶定制的 RAG 產(chǎn)品。或是下一個 ChatGPT?最近幾天,人們似乎對一款已經(jīng)不新鮮的 AI 助手 Noteboo...
閱讀原文

Meta又給OpenAI一記重擊,視頻生成Movie Gen震撼登場,甚至可以配音、編輯

機器之心報道 編輯:Panda、大盤雞視頻生成領(lǐng)域真是越來越卷且越來越邁向?qū)嵱眯裕?在 OpenAI Sora 難產(chǎn)的時候,Meta 首次公開展示了自家的「用于媒體的突破性...
閱讀原文

大神卡帕西安利爆火AI應(yīng)用,稱「或是下一個ChatGPT」

衡宇 發(fā)自 凹非寺量子位 | 公眾號 QbitAI大神卡帕西墻裂推薦! 甚至預(yù)言這個AI應(yīng)用,有可能開啟「和ChatGPT一樣大的機會」。 它就是來自谷歌的實驗性AI產(chǎn)品,...
閱讀原文

三只羊盧總的錄音AI到底能不能做出來?我的答案是:當然能。

大數(shù)據(jù)文摘受權(quán)轉(zhuǎn)載自數(shù)字生命卡茲克 作者:卡茲克 今天凌晨,N多人給我發(fā)了一張圖,說警方通報了,問我到底怎么看三只羊錄音是不是AI這事。 還有朋友跟我說...
閱讀原文

150萬條多語種音頻數(shù)據(jù)!浙大清華發(fā)布語音偽造檢測框架SafeEar,兼顧隱私保護|CCS 2024

新智元報道編輯:LRST 【新智元導(dǎo)讀】SafeEar是一種內(nèi)容隱私保護的語音偽造檢測方法,其核心是設(shè)計基于神經(jīng)音頻編解碼器的解耦模型,分離語音聲學與語義信息...
閱讀原文

開源版GPT-4o來了,AI大神Karpathy盛贊!67頁技術(shù)報告全公開

新智元報道編輯:alan 【新智元導(dǎo)讀】兩個多月前那個對標GPT-4o的端到端語音模型,終于開源了。大神Karpathy體驗之后表示:nice!前段時間技驚四座、劍指GPT-...
閱讀原文

開源版《Her》來了,技術(shù)報告已公開!大神Karpathy:它很有個性

一水 發(fā)自 凹非寺量子位 | 公眾號 QbitAI大神Karpathy鼎力推薦,開源版「Her」Moshi再引關(guān)注! (Moshi)的性格非常有趣,它會突然斷斷續(xù)續(xù),有時會無緣無故...
閱讀原文

字節(jié)音樂大模型炸場!Seed-Music發(fā)布,支持一鍵生成高質(zhì)量歌曲、片段編輯等

機器之心發(fā)布 機器之心編輯部高質(zhì)量音樂生成、高靈活音樂編輯,Seed-Music 再次打開了 AI 音樂創(chuàng)作的天花板。放假期間,本 i 人又領(lǐng)教了被 e 人支配的恐懼。 ...
閱讀原文

字節(jié)AI版小李子一開口:黃風嶺,八百里

叨樂 發(fā)自 凹非寺量子位 | 公眾號 QbitAI字節(jié)和浙大聯(lián)合研發(fā)的項目Loopy火了! 只需一幀圖像,一段音頻,就能生成一段非常自然的視頻! 研究團隊還放出了Loop...
閱讀原文

音頻驅(qū)動人像視頻模型:字節(jié)Loopy、CyberHost研究成果揭秘

機器之心發(fā)布 機器之心編輯部近期,來自字節(jié)跳動的視頻生成模型 Loopy,一經(jīng)發(fā)布就在 X 上引起了廣泛的討論。Loopy 可以僅僅通過一張圖片和一段音頻生成逼真...
閱讀原文
1236