標(biāo)簽:語音
WPS接入DeepSeek,秒變辦公神器!
WPS 大家經(jīng)常用來日常寫作,雖然本身提供了AI功能,但可惜需要會(huì)員,本文教你三分鐘接入最火的DeepSeek,讓W(xué)PS秒變辦公神器。 DeepSeek API申請地址:http:/...
AI賺錢副業(yè)~AI生成影視解說,半個(gè)月漲粉變現(xiàn)3.5W+!
這兩年大家都在感嘆生活不易,然而我想說的是,機(jī)會(huì)還是有的,但問題不在于有沒有,而在于你是否能夠認(rèn)準(zhǔn)機(jī)會(huì),然后抓住它。 接觸過很多咨詢項(xiàng)目的人,發(fā)現(xiàn)...
語音AI賽道全解析:市場規(guī)模超 50 億,最有機(jī)會(huì)的場景在哪里?
「未來,消費(fèi)者更可能傾向于與 AI 溝通,而非人工客服,因?yàn)檫@將成為解決問題的最高效途徑。」 這篇來自 Bessemer Venture Partners 的報(bào)告,是目前為止對語...
Alexa 做了 10 年,銷量 4000 萬臺(tái),卻還是一個(gè)智能鬧鐘
十年前,2014 年 11 月 6 日,Alexa 發(fā)布,對貝佐斯來說,這個(gè)項(xiàng)目代表著未來。 名字來源于《星際迷航》中的「計(jì)算機(jī)」,語音控制的全能 AI 助手。 「從科幻...
大模型重塑智能硬件!人手一個(gè)智能助手的時(shí)代來了?
▲圖像由AI生成 能“動(dòng)口”解決的事情,不用總是“動(dòng)手”啦。 作者|徐豫 編輯|漠影 在生成式AI浪潮的影響下,智能硬件開始出現(xiàn)全新的人機(jī)交互體驗(yàn)。 AI智能助手更...
大規(guī)模、動(dòng)態(tài)「語音增強(qiáng)/分離」新基準(zhǔn)!清華發(fā)布移動(dòng)音源仿真平臺(tái)SonicSim,含950+小時(shí)訓(xùn)練數(shù)據(jù)
新智元報(bào)道編輯:LRST 【新智元導(dǎo)讀】清華大學(xué)推出的SonicSim平臺(tái)和SonicSet數(shù)據(jù)集針對動(dòng)態(tài)聲源的語音處理研究提供了強(qiáng)有力的工具和數(shù)據(jù)支持,有效降低了數(shù)據(jù)...
國產(chǎn)最強(qiáng)語音大模型誕生,MaskGCT宣布開源,聲音效果媲美人類
AIxiv專欄是機(jī)器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過去數(shù)年,機(jī)器之心AIxiv專欄接收報(bào)道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級實(shí)驗(yàn)室,有效促進(jìn)了學(xué)術(shù)...
大模型重塑版訊飛輸入法來了!能懂每個(gè)人的AI輸入
搭載訊飛星火端側(cè)輸入大模型、訊飛星火語音大模型的訊飛輸入法14.0亮相。 作者|程茜 編輯|漠影 智東西10月28日報(bào)道,訊飛輸入法又上新,這次是端側(cè)大模型重塑...
谷歌AI播客剛火,Meta就開源了平替,效果一言難盡
機(jī)器之心報(bào)道 編輯:杜偉、陳陳隨著谷歌和 Meta 相繼推出基于大語言模型的 AI 播客功能,將極大地豐富人類用戶與 AI 智能體互動(dòng)的體驗(yàn)。上個(gè)月,谷歌宣布對旗...
CNCC 落幕:國產(chǎn)大模型已經(jīng)進(jìn)化到能在橫店給我們點(diǎn)咖啡
多模態(tài) AI 之所以能成為趨勢,是因?yàn)槠溆|達(dá)了人類智能的本質(zhì)。作者丨朱可軒 編輯丨陳彩嫻 今年到 CNCC 現(xiàn)場參會(huì)的朋友,想必都對 CNCC 2024 舉辦所在地——超過...
智能眼鏡這個(gè)被忽略的功能,他們已經(jīng)離不開了
字幕是 一種 權(quán)利字幕,已經(jīng)成了現(xiàn)代人的「外掛」。通勤嘈雜,摸魚易露餡,學(xué)習(xí)會(huì)分心,聽和看并用,才能避免進(jìn)度條白白走了冤枉路。 然而,對一些人來說,字...
震驚!AI竟然學(xué)會(huì)了100種撒嬌方式,讓我分不清是人是鬼
夕小瑤科技說 原創(chuàng)作者 | 夕小瑤編輯部最近,我的AI助手簡直像是開了掛一樣!不僅能說會(huì)道,還能……撒嬌?!而且是100種花式撒嬌,招招致命,讓我毫無招架之力...
剛剛,我們感受了一波最「像人」的國產(chǎn)AI,模型還是開源的
機(jī)器之心原創(chuàng) 作者:杜偉、蛋醬今年 5 月,OpenAI 首次展示了 GPT-4o 的語音功能,無論是對話的響應(yīng)速度還是與真人聲音的相似度,都頗為驚艷。特別是它允許用...
開源數(shù)字人實(shí)時(shí)對話:形象可自定義,支持語音輸入,對話首包延遲可低至3s|已上線阿里ModelScope魔搭社區(qū)
池?zé)樅悖ǔ鼗?投稿量子位 | 公眾號(hào) QbitAI開源數(shù)字人實(shí)時(shí)對話Demo來了~ 支持語音輸入和實(shí)時(shí)對話,數(shù)字人形象可自定義的那種。 生成的數(shù)字人效果belike: ...
高通驍龍 8 至尊版發(fā)布,主頻超 4GHz,Benchmark 6 多核破 1 萬
牙膏 擠爆高通的驍龍旗艦芯片這幾年的命名幾經(jīng)變更,比如前幾年突然出現(xiàn)的驍龍 888,主要圖一個(gè)吉利,后面變成了驍龍 8 Gen1、Gen2、Gen3,到了今年驍龍移動(dòng)...
SAM 2.1上新、Lingua代碼庫發(fā)布,一Meta開源工具來襲
機(jī)器之心報(bào)道 機(jī)器之心編輯部????今天,Meta 分享了一系列研究和模型,這些研究和模型支撐 Meta 實(shí)現(xiàn)高級機(jī)器智能(AMI)目標(biāo),同時(shí)也致力于開放科學(xué)和可復(fù)現(xiàn)...
Voice-first,閉關(guān)做一款語音產(chǎn)品的思考
三個(gè)月前我在硅谷沉浸式泡了兩個(gè)多月把產(chǎn)品上的整體感受和幾個(gè)趨勢簡短寫在了這里,在和不同的創(chuàng)業(yè)者交流研究了 40 多個(gè)產(chǎn)品后,最終回歸到了“語音”這個(gè)方向...
粵公網(wǎng)安備 44011502001135號(hào)