
AIGC動態歡迎閱讀
原標題:剛剛,我們感受了一波最「像人」的國產AI,模型還是開源的
關鍵字:語音,模型,解讀,音頻,能力
文章來源:機器之心
內容字數:0字
內容摘要:
機器之心原創
作者:杜偉、蛋醬今年 5 月,OpenAI 首次展示了 GPT-4o 的語音功能,無論是對話的響應速度還是與真人聲音的相似度,都頗為驚艷。特別是它允許用戶隨時打斷,充分感知到用戶的情緒并給予回應。
大家突然發現,原來 AI 語音通話還能這么玩?
但由于種種原因,用戶們等了好久才等到 OpenAI 開放 ChatGPT 的高級語音功能,目前僅 Plus 和 Team 用戶可體驗,且這些用戶每天也有使用時長限制。
不過現在,國內用戶也有了同樣絲滑的實時語音交互應用,重點是:免費開放,無需等待。
10 月 25 日,智譜清言宣布全量上線「情感語音通話」功能,任何用戶都可以立即獲得端到端情感語音體驗。
對標 GPT-4o,智譜清言「情感語音通話」在響應和打斷速度、情緒感知情感共鳴、語音可控表達、多語言多方言等方面實現了突破。簡單來說,「情感語音通話」提供了一個真人一般的對話伙伴,而不僅僅是一個文字的朗讀者。精通各種方言,比如這段北京烤鴨的介紹,那叫一個地道:與此同時,智譜還重磅宣布,該功能背后的情感語音模型 GLM-4-Voice 同步正式開源。不久后,相關能力還將上線視頻通話,
原文鏈接:剛剛,我們感受了一波最「像人」的國產AI,模型還是開源的
聯系作者
文章來源:機器之心
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...

粵公網安備 44011502001135號