最難方言溫州話被攻克！中國電信語音大模型支持30種方言，這題GPT-4o可不會做啊

AIGC動態1年前 (2024)發布量子位

AIGC動態歡迎閱讀

原標題：最難方言溫州話被攻克！中國電信語音大模型支持30種方言，這題GPT-4o可不會做啊
關鍵字：模型,方言,語音,中國電信,數據
文章來源：量子位
內容字數：8271字

內容摘要：

白交發自凹非寺量子位 | 公眾號 QbitAI更適配中文的語音大模型來了——
來自中國電信人工智能研究院，AI領域Fellow大滿貫科學家李學龍帶隊，發布首個能聽懂30多種多方言混說的大模型。
號稱最難方言、“魔鬼的語言”的溫州話，也不在話下。
還有超自然的語音生成能力。
在2024智算云生態大會上，星辰語音大模型被官宣發布并開源。
要知道，當前語音模型開源開放本來就少，而針對方言更是特定方言特定模型。
開源且支持30種方言，有且只有星辰這么一個。
作為首個完成大語言模型的研發且開源的央企，中國電信現在又在語音模態領域秀起了肌肉。
首個支持30種方言混說語音大模型那就來說道此次發布的能支持最多方言的語音大模型，核心功能主要體現在識別上——
它打破了單一模型只能識別特定單一方言的困境，可同時識別理解粵語、上海話、四川話、溫州話等30多種方言。
實際上，它早已獲得國際權威賽事的能力認證，以及多個實際場景中落地。
它在國際語音頂會INTERSPEECH2024離散語音單元建模挑戰賽上，星辰語音識別大模型斬獲了語音識別賽道冠軍。
同時在NIST（美國國家標準與技術研究院）舉辦的低資源粵語電

原文鏈接：最難方言溫州話被攻克！中國電信語音大模型支持30種方言，這題GPT-4o可不會做啊