剛剛,我們感受了一波最「像人」的國(guó)產(chǎn)AI,模型還是開源的
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:剛剛,我們感受了一波最「像人」的國(guó)產(chǎn)AI,模型還是開源的
關(guān)鍵字:語(yǔ)音,模型,解讀,音頻,能力
文章來(lái)源:機(jī)器之心
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
機(jī)器之心原創(chuàng)
作者:杜偉、蛋醬今年 5 月,OpenAI 首次展示了 GPT-4o 的語(yǔ)音功能,無(wú)論是對(duì)話的響應(yīng)速度還是與真人聲音的相似度,都頗為驚艷。特別是它允許用戶隨時(shí)打斷,充分感知到用戶的情緒并給予回應(yīng)。
大家突然發(fā)現(xiàn),原來(lái) AI 語(yǔ)音通話還能這么玩?
但由于種種原因,用戶們等了好久才等到 OpenAI 開放 ChatGPT 的高級(jí)語(yǔ)音功能,目前僅 Plus 和 Team 用戶可體驗(yàn),且這些用戶每天也有使用時(shí)長(zhǎng)限制。
不過(guò)現(xiàn)在,國(guó)內(nèi)用戶也有了同樣絲滑的實(shí)時(shí)語(yǔ)音交互應(yīng)用,重點(diǎn)是:免費(fèi)開放,無(wú)需等待。
10 月 25 日,智譜清言宣布全量上線「情感語(yǔ)音通話」功能,任何用戶都可以立即獲得端到端情感語(yǔ)音體驗(yàn)。
對(duì)標(biāo) GPT-4o,智譜清言「情感語(yǔ)音通話」在響應(yīng)和打斷速度、情緒感知情感共鳴、語(yǔ)音可控表達(dá)、多語(yǔ)言多方言等方面實(shí)現(xiàn)了突破。簡(jiǎn)單來(lái)說(shuō),「情感語(yǔ)音通話」提供了一個(gè)真人一般的對(duì)話伙伴,而不僅僅是一個(gè)文字的朗讀者。精通各種方言,比如這段北京烤鴨的介紹,那叫一個(gè)地道:與此同時(shí),智譜還重磅宣布,該功能背后的情感語(yǔ)音模型 GLM-4-Voice 同步正式開源。不久后,相關(guān)能力還將上線視頻通話,
原文鏈接:剛剛,我們感受了一波最「像人」的國(guó)產(chǎn)AI,模型還是開源的
聯(lián)系作者
文章來(lái)源:機(jī)器之心
作者微信:
作者簡(jiǎn)介: