AIGC動態歡迎閱讀
原標題:車圈最大AI「黑馬」吉利:自研語音大模型登頂,性能超SOTA 10%
關鍵字:模型,語音,吉利,解讀,音色
文章來源:量子位
內容字數:0字
內容摘要:
賈浩楠 發自 凹非寺量子位 | 公眾號 QbitAI語音合成大模型賽道,王者一夜易主。
最新HAM-TTS大模型,在發音準確性、自然度和說話人相似度上對比之前SOTA成果VALL-E,有了大幅提升。
背后的主要科研團隊卻是LLM賽道今年最令人意外的一匹“黑馬”:
吉利汽車。
沒錯,不是AI原生公司,不是傳統的科技巨頭,是以汽車知名但正在不斷展現硬科技實力的吉利。
吉利星睿AI大模型,有什么用?吉利自研語音大模型HAM-TTS的全稱是:
Hierarchical Acoustic Modeling for Token-Based Zero-Shot Text-to-Speech,直譯是基于token的零樣本文字轉語音分層聲學建模,是星睿AI大模型體系下的重要一員。顧名思義,對于智能座艙體驗來說,這項技術作用在最關鍵的交互環節:“發音”。
語音助手說的好不好,通常有這么幾個評價指標:
發音準確度,通過Character Error Rate(CER)來評判,具體由知名端到端語音模型平臺ESPNet來打分。
說話風格的一致性NMOS、音調一致性SMOS,以及整體分數MOS,是由研究團隊招募的
原文鏈接:車圈最大AI「黑馬」吉利:自研語音大模型登頂,性能超SOTA 10%
聯系作者
文章來源:量子位
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...