AIGC動態歡迎閱讀
原標題:小米新一代Kaldi團隊論文解讀:新型自動語音識別 (ASR) 模型Zipformer誕生之路|ICLR 2024 Oral
關鍵字:小米,模型,解讀,模塊,參數
文章來源:機器之心
內容字數:24168字
內容摘要:
機器之心專欄
作者:新一代 Kaldi 團隊近日,小米集團新一代 Kaldi 團隊關于語音識別聲學模型的論文《Zipformer: A faster and better encoder for automatic speech recognition》被 ICLR 2024 接收為 Oral (Top 1.2%)。論文鏈接:https://arxiv.org/pdf/2310.11230.pdf
代碼鏈接:https://github.com/k2-fsa/icefall/tree/master/egs/librispeech/ASR/zipformer
團隊介紹
新一代 Kaldi 團隊是由 Kaldi 之父、IEEE fellow、小米集團首席語音科學家 Daniel Povey 領銜的團隊,專注于開源語音基礎引擎研發,從神經網絡聲學編碼器、損失函數、優化器和解碼器等各方面重構語音技術鏈路,旨在提高智能語音任務的準確率和效率。
目前,新一代 Kaldi 項目主要由四個子項目構成:核心算法庫 k2、通用語音數據處理工具包 Lhotse、解決方案集合 Icefall 以及服務端引擎
原文鏈接:小米新一代Kaldi團隊論文解讀:新型自動語音識別 (ASR) 模型Zipformer誕生之路|ICLR 2024 Oral
聯系作者
文章來源:機器之心
作者微信:almosthuman2014
作者簡介:專業的人工智能媒體和產業服務平臺
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...