剛剛,我們感受了一波最「像人」的國產(chǎn)AI,模型還是開源的
AIGC動態(tài)歡迎閱讀
原標(biāo)題:剛剛,我們感受了一波最「像人」的國產(chǎn)AI,模型還是開源的
關(guān)鍵字:語音,模型,解讀,音頻,能力
文章來源:機(jī)器之心
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
機(jī)器之心原創(chuàng)
作者:杜偉、蛋醬今年 5 月,OpenAI 首次展示了 GPT-4o 的語音功能,無論是對話的響應(yīng)速度還是與真人聲音的相似度,都頗為驚艷。特別是它允許用戶隨時打斷,充分感知到用戶的情緒并給予回應(yīng)。
大家突然發(fā)現(xiàn),原來 AI 語音通話還能這么玩?
但由于種種原因,用戶們等了好久才等到 OpenAI 開放 ChatGPT 的高級語音功能,目前僅 Plus 和 Team 用戶可體驗,且這些用戶每天也有使用時長限制。
不過現(xiàn)在,國內(nèi)用戶也有了同樣絲滑的實時語音交互應(yīng)用,重點是:免費開放,無需等待。
10 月 25 日,智譜清言宣布全量上線「情感語音通話」功能,任何用戶都可以立即獲得端到端情感語音體驗。
對標(biāo) GPT-4o,智譜清言「情感語音通話」在響應(yīng)和打斷速度、情緒感知情感共鳴、語音可控表達(dá)、多語言多方言等方面實現(xiàn)了突破。簡單來說,「情感語音通話」提供了一個真人一般的對話伙伴,而不僅僅是一個文字的朗讀者。精通各種方言,比如這段北京烤鴨的介紹,那叫一個地道:與此同時,智譜還重磅宣布,該功能背后的情感語音模型 GLM-4-Voice 同步正式開源。不久后,相關(guān)能力還將上線視頻通話,
原文鏈接:剛剛,我們感受了一波最「像人」的國產(chǎn)AI,模型還是開源的
聯(lián)系作者
文章來源:機(jī)器之心
作者微信:
作者簡介:
? 版權(quán)聲明
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載。
相關(guān)文章
暫無評論...