標簽:語音
WPS接入DeepSeek,秒變辦公神器!
WPS 大家經常用來日常寫作,雖然本身提供了AI功能,但可惜需要會員,本文教你三分鐘接入最火的DeepSeek,讓WPS秒變辦公神器。 DeepSeek API申請地址:http:/...
AI賺錢副業~AI生成影視解說,半個月漲粉變現3.5W+!
這兩年大家都在感嘆生活不易,然而我想說的是,機會還是有的,但問題不在于有沒有,而在于你是否能夠認準機會,然后抓住它。 接觸過很多咨詢項目的人,發現...
語音AI賽道全解析:市場規模超 50 億,最有機會的場景在哪里?
「未來,消費者更可能傾向于與 AI 溝通,而非人工客服,因為這將成為解決問題的最高效途徑。」 這篇來自 Bessemer Venture Partners 的報告,是目前為止對語...
Alexa 做了 10 年,銷量 4000 萬臺,卻還是一個智能鬧鐘
十年前,2014 年 11 月 6 日,Alexa 發布,對貝佐斯來說,這個項目代表著未來。 名字來源于《星際迷航》中的「計算機」,語音控制的全能 AI 助手。 「從科幻...
大模型重塑智能硬件!人手一個智能助手的時代來了?
▲圖像由AI生成 能“動口”解決的事情,不用總是“動手”啦。 作者|徐豫 編輯|漠影 在生成式AI浪潮的影響下,智能硬件開始出現全新的人機交互體驗。 AI智能助手更...
大規模、動態「語音增強/分離」新基準!清華發布移動音源仿真平臺SonicSim,含950+小時訓練數據
新智元報道編輯:LRST 【新智元導讀】清華大學推出的SonicSim平臺和SonicSet數據集針對動態聲源的語音處理研究提供了強有力的工具和數據支持,有效降低了數據...
國產最強語音大模型誕生,MaskGCT宣布開源,聲音效果媲美人類
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
大模型重塑版訊飛輸入法來了!能懂每個人的AI輸入
搭載訊飛星火端側輸入大模型、訊飛星火語音大模型的訊飛輸入法14.0亮相。 作者|程茜 編輯|漠影 智東西10月28日報道,訊飛輸入法又上新,這次是端側大模型重塑...
谷歌AI播客剛火,Meta就開源了平替,效果一言難盡
機器之心報道 編輯:杜偉、陳陳隨著谷歌和 Meta 相繼推出基于大語言模型的 AI 播客功能,將極大地豐富人類用戶與 AI 智能體互動的體驗。上個月,谷歌宣布對旗...
CNCC 落幕:國產大模型已經進化到能在橫店給我們點咖啡
多模態 AI 之所以能成為趨勢,是因為其觸達了人類智能的本質。作者丨朱可軒 編輯丨陳彩嫻 今年到 CNCC 現場參會的朋友,想必都對 CNCC 2024 舉辦所在地——超過...
智能眼鏡這個被忽略的功能,他們已經離不開了
字幕是 一種 權利字幕,已經成了現代人的「外掛」。通勤嘈雜,摸魚易露餡,學習會分心,聽和看并用,才能避免進度條白白走了冤枉路。 然而,對一些人來說,字...
震驚!AI竟然學會了100種撒嬌方式,讓我分不清是人是鬼
夕小瑤科技說 原創作者 | 夕小瑤編輯部最近,我的AI助手簡直像是開了掛一樣!不僅能說會道,還能……撒嬌?!而且是100種花式撒嬌,招招致命,讓我毫無招架之力...
剛剛,我們感受了一波最「像人」的國產AI,模型還是開源的
機器之心原創 作者:杜偉、蛋醬今年 5 月,OpenAI 首次展示了 GPT-4o 的語音功能,無論是對話的響應速度還是與真人聲音的相似度,都頗為驚艷。特別是它允許用...
開源數字人實時對話:形象可自定義,支持語音輸入,對話首包延遲可低至3s|已上線阿里ModelScope魔搭社區
池煒恒(池化) 投稿量子位 | 公眾號 QbitAI開源數字人實時對話Demo來了~ 支持語音輸入和實時對話,數字人形象可自定義的那種。 生成的數字人效果belike: ...
高通驍龍 8 至尊版發布,主頻超 4GHz,Benchmark 6 多核破 1 萬
牙膏 擠爆高通的驍龍旗艦芯片這幾年的命名幾經變更,比如前幾年突然出現的驍龍 888,主要圖一個吉利,后面變成了驍龍 8 Gen1、Gen2、Gen3,到了今年驍龍移動...
SAM 2.1上新、Lingua代碼庫發布,一Meta開源工具來襲
機器之心報道 機器之心編輯部????今天,Meta 分享了一系列研究和模型,這些研究和模型支撐 Meta 實現高級機器智能(AMI)目標,同時也致力于開放科學和可復現...
Voice-first,閉關做一款語音產品的思考
三個月前我在硅谷沉浸式泡了兩個多月把產品上的整體感受和幾個趨勢簡短寫在了這里,在和不同的創業者交流研究了 40 多個產品后,最終回歸到了“語音”這個方向...