標簽:聲學

WPS接入DeepSeek,秒變辦公神器!

WPS 大家經(jīng)常用來日常寫作,雖然本身提供了AI功能,但可惜需要會員,本文教你三分鐘接入最火的DeepSeek,讓WPS秒變辦公神器。 DeepSeek API申請地址:http:/...
閱讀原文

AI賺錢副業(yè)~AI生成影視解說,半個月漲粉變現(xiàn)3.5W+!

這兩年大家都在感嘆生活不易,然而我想說的是,機會還是有的,但問題不在于有沒有,而在于你是否能夠認準機會,然后抓住它。 接觸過很多咨詢項目的人,發(fā)現(xiàn)...

大規(guī)模、動態(tài)「語音增強/分離」新基準!清華發(fā)布移動音源仿真平臺SonicSim,含950+小時訓練數(shù)據(jù)

新智元報道編輯:LRST 【新智元導讀】清華大學推出的SonicSim平臺和SonicSet數(shù)據(jù)集針對動態(tài)聲源的語音處理研究提供了強有力的工具和數(shù)據(jù)支持,有效降低了數(shù)據(jù)...
閱讀原文

國產(chǎn)最強語音大模型誕生,MaskGCT宣布開源,聲音效果媲美人類

AIxiv專欄是機器之心發(fā)布學術(shù)、技術(shù)內(nèi)容的欄目。過去數(shù)年,機器之心AIxiv專欄接收報道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級實驗室,有效促進了學術(shù)...
閱讀原文

AI音頻成詐騙神器!律師父親險被騙走21萬,3秒原聲即可克隆聲音

新智元報道編輯:編輯部 HXY 【新智元導讀】Deepfake到底有多可怕?國外一名律師的父親,險些陷入一場巨大AI騙局。詐騙者借助AI克隆其兒子的聲音,偽造車禍事...
閱讀原文

150萬條多語種音頻數(shù)據(jù)!浙大清華發(fā)布語音偽造檢測框架SafeEar,兼顧隱私保護|CCS 2024

新智元報道編輯:LRST 【新智元導讀】SafeEar是一種內(nèi)容隱私保護的語音偽造檢測方法,其核心是設計基于神經(jīng)音頻編解碼器的解耦模型,分離語音聲學與語義信息...
閱讀原文

能跟「貓主子」了!生成式AI帶來的全面:最快5年內(nèi)破譯第一種動物語言

新智元報道編輯:LRS【新智元導讀】ChatGPT用它自己的方式來理解世界,類似的技術(shù)是否也能用來學習動物的語言?所羅門能夠與動物交流并不是因為他擁有魔法物...
閱讀原文