MiniMax 的海螺語音很難找到對手。
原標題:幾十個測試后,發現海螺語音與 ElevenLabs 掰手腕的能力不是蓋的
文章來源:AI科技評論
內容字數:7812字
MiniMax海螺語音:AI語音生成領域的強勁競爭者
本文介紹了MiniMax公司推出的海螺語音,一款基于升級語音大模型T2A-01系列的AI語音生成工具。通過與其他語音生成產品(如ChatTTS、ElevenLabs)的對比,展現了海螺語音在語音質量、多語言支持和情緒控制方面的優勢。
1. 海螺語音:穩定高質量的語音生成
海螺語音能夠穩定地生成高質量語音,支持中文、粵語、英語等17種語言和上百種音色。在繞口令“施氏食獅史”的測試中,海螺語音的表現顯著優于ChatTTS和ElevenLabs,展現了其強大的語音處理能力和對同聲詞的精準把握。 其語音自然流暢,接近真人發音,無需“抽卡”即可達到高水平的穩定輸出。
2. 多語言能力與ElevenLabs比肩
海螺語音的多語言合成能力與行業領先者ElevenLabs不相上下。MiniMax團隊采用嚴謹的評測方法,結果顯示海螺語音在中文、粵語、英語等多個語種上的相似度和正確率均大幅領先。 文章中通過用九種語言朗讀楊冪的廣告語“你沒事吧?”的例子,生動地展現了海螺語音的多語言能力和情緒表達能力。
3. 精準的情緒表達和音色控制
海螺語音的一大亮點在于其精準的情緒表達和音色控制能力。通過對海量高質量音頻數據的訓練,海螺語音能夠識別并重現語音中細微的情感差別,并支持用戶自定義情緒(開心、難過、生氣等)和音色(語言、口音、性別、年齡等),甚至可以控制聲音的細節,如低沉/明亮、力量感/柔和等。文章中用粵語朗讀古詩和模擬老人情緒變化的例子,充分展示了海螺語音在情緒控制方面的優勢。
4. MiniMax在AGI領域的長期投入
MiniMax在AI語音領域的技術積累深厚,其對語音大模型的開發投入早于許多大廠。 公司致力于發展多模態AI技術,并將語音模型視為AGI發展的重要路徑。海螺語音的推出,是MiniMax在多模態領域長期投入和持續發力的結果,也體現了其在AI領域的創新能力和技術實力。
總而言之,MiniMax的海螺語音憑借其高質量的語音生成能力、強大的多語言支持、精準的情緒控制和豐富的音色選擇,在AI語音生成領域展現出強大的競爭力,有望成為該領域的領軍者。
聯系作者
文章來源:AI科技評論
作者微信:
作者簡介:雷峰網旗下AI新媒體。聚焦AI前沿研究,關注AI工程落地。