標簽:語音

名場面來了,李云龍、徐江、王多魚同臺飆戲,背后是小紅書的AI

AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
閱讀原文

讓大模型能聽會說,國內機構開源全球首個端到端語音對話模型Mini-Omni

AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
閱讀原文

MiniMax不藏了,大秀視頻/語音/文本全模態模型家族,“每天與世界交互30億次”

明敏 衡宇 發自 凹非寺量子位 | 公眾號 QbitAI終于,MiniMax不藏了。 首次正式公開亮相,最強大模型、最亮眼產品戰績,全部對外展示。 模型全家桶最新版齊上...
閱讀原文

訊飛版「Her」橫空出世全民開放!百變人設逼真絲滑,情緒價值逆天

新智元報道編輯:編輯部 【新智元導讀】OpenAI的「Her」還是期貨,訊飛星火版「Her」就搶先上線了!不僅極速響應自由打斷,還情緒價值拉滿,各種情感、風格、...
閱讀原文

失語四年,AI幫他重新“開口”說話

大數據文摘授權轉載自學術頭條 撰文:馬雪薇肌萎縮側索硬化(ALS),又名漸凍癥,是一種神經系統罕見病,被世界衛生組織(WHO)列為與艾滋病、癌癥等并列的 5...
閱讀原文

大模型時代的ASR就是不一樣!豆包“聽力”水平現場評測,方言&小朋友口音直接拿捏!

機器之心發布 機器之心編輯部2024 火山引擎 AI 創新巡展上海站于近日舉辦,活動展示了豆包大模型在綜合評分、語音識別等方面的效果提升,還發布了對話式 AI ...
閱讀原文

豆包版《Her》升級上新!隨時打斷,交流自然,還是開箱即用的那種

允中 發自 凹非寺量子位 | 公眾號 QbitAI豆包大模型應用落地,又有新進展。 8月21日,火山引擎在AI創新巡展活動上發布了豆包大模型的一系列產品升級。 據活動...
閱讀原文

英偉達首個AI NPC入駐游戲,國產大作,4B模型只需2G顯存

機器之心報道 編輯:澤南玩家都在問:游戲什么時候上線?大模型驅動的游戲 NPC 終于落地了。 今天凌晨,英偉達放出一段游戲 demo。現在打游戲,你可以用語音...
閱讀原文

準確率97%,將大腦信號轉化為語音,新型腦機接口讓失語者「說話」

來源:ScienceAI 編輯:蘿卜皮 肌萎縮性脊髓側索硬化癥又稱漸凍人癥(ALS),會影響控制全身運動的神經細胞。這種疾病會導致患者逐漸喪失站立、行走和使用雙...
閱讀原文

1篇Outstanding、5篇Oral!字節跳動今年ACL這么猛? 來直播間聊聊!

本周學術界矚目的焦點,無疑是在泰國曼谷舉行的 ACL 2024 頂會。這場盛會吸引了全球眾多杰出的研究者,大家匯聚一堂,共同探討和分享最新學術成果。 官方公布...
閱讀原文

谷歌「Her」來啦!發布Gemini Live語音模式,現場演示兩次翻車

夕小瑤科技說 原創作者 | 海野重磅驚喜! 今天,在MadeByGoogle發布會上,谷歌公布了 AI語音助手 Gemini Live,對標的正是GPT-4o,而且是兩周前開放測試的語...
閱讀原文

谷歌版Her搶跑!一鍵召喚Gemini,全球52億終端被顛覆

新智元報道編輯:編輯部 【新智元導讀】谷歌版Her,搶先OpenAI登場了?谷歌語音模型Gemini Live,即將在全球30億安卓和22億iOS設備中上線。雖然現場演示依舊...
閱讀原文

首個支持普通話和方言混說的TTS大模型:河南話、上海話、粵語說得溜

AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
閱讀原文

GPT-4o模仿人類聲音,詭異尖叫引OpenAI研究員恐慌!32頁技術報告出爐

新智元報道編輯:編輯部 【新智元導讀】五顆草莓到底指什么?盼了一天一夜,OpenAI只發來一份32頁安全報告。報告揭露:在少數情況下,GPT-4o會模仿你的聲音說...
閱讀原文

無比順滑!告別TTS!賈揚清領銜的Lepton AI推出實時語音交互

夕小瑤科技說 分享作者 | 谷雨龍澤事到如今,各種AI助手滿天飛,語音功能也不是什么稀罕物了。 “明天早上會不會下雨?” “導航去火車站” “幫我預訂××餐廳的桌...
閱讀原文
1234512