<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        小紅書語音識別新突破!開源FireRedASR,中文效果新SOTA

        AIGC動態(tài)3個月前發(fā)布 機器之心
        322 0 0

        模型和代碼已經(jīng)全部開源。

        小紅書語音識別新突破!開源FireRedASR,中文效果新SOTA

        原標(biāo)題:小紅書語音識別新突破!開源FireRedASR,中文效果新SOTA
        文章來源:機器之心
        內(nèi)容字?jǐn)?shù):3159字

        小紅書FireRed團隊開源基于大模型的語音識別模型FireRedASR,刷新SOTA

        機器之心AIxiv專欄報道了小紅書FireRed團隊最新開源的基于大模型的語音識別模型FireRedASR。該模型在中文語音識別領(lǐng)域取得了顯著突破,并在多個公開測試集上刷新了SOTA(State-Of-The-Art),其字錯誤率(CER)指標(biāo)大幅降低,展現(xiàn)了強大的性能和廣泛的應(yīng)用潛力。

        1. FireRedASR模型概述

        FireRedASR系列模型包含兩種核心結(jié)構(gòu):FireRedASR-LLM和FireRedASR-AED。FireRedASR-LLM結(jié)合了文本預(yù)訓(xùn)練LLM的能力,追求極致的識別準(zhǔn)確率,適用于對準(zhǔn)確性要求極高的應(yīng)用場景。FireRedASR-AED基于經(jīng)典的Attention-based Encoder-Decoder架構(gòu),通過擴展參數(shù)至1.1B,在高準(zhǔn)確率和推理效率之間取得了平衡。

        2. 性能突破與SOTA刷新

        在業(yè)界常用的中文普通話公開測試集上,F(xiàn)ireRedASR-LLM(8.3B參數(shù)量)取得了最佳CER 3.05%,成為新的SOTA!FireRedASR-AED(1.1B參數(shù)量)緊隨其后,CER為3.18%。兩者均優(yōu)于此前的SOTA模型Seed-ASR(12+B參數(shù)量),且參數(shù)量更小。此外,F(xiàn)ireRedASR在AISHELL-1、AISHELL-2 iOS測試集以及WenetSpeech的Internet和Meeting測試集上也表現(xiàn)出色,均優(yōu)于Qwen-Audio、SenseVoice、Whisper和Paraformer等模型。

        3. 多場景應(yīng)用及優(yōu)勢

        FireRedASR不僅在公開測試集上表現(xiàn)優(yōu)異,在包含短視頻、直播、語音輸入和智能助手等多種來源的Speech測試集上,F(xiàn)ireRedASR-LLM的CER相對領(lǐng)先的ASR服務(wù)提供商和Paraformer-Large降低了23.7%~40.0%。在歌詞識別場景中,CER更是降低了50.2%~66.7%。此外,F(xiàn)ireRedASR在中文方言(KeSpeech)和英語(LibriSpeech)測試集上也表現(xiàn)不俗,顯著優(yōu)于之前的開源SOTA模型,展現(xiàn)了其強大的語言適配能力和魯棒性。

        4. 開源貢獻(xiàn)

        FireRed團隊已將FireRedASR的模型和代碼全部開源,旨在為語音社區(qū)做出貢獻(xiàn),促進(jìn)ASR的應(yīng)用和端到端語音交互的發(fā)展。其開源地址為:https://github.com/FireRedTeam/FireRedASR。

        5. 論文信息

        論文標(biāo)題:FireRedASR: Open-Source Industrial-Grade Mandarin Speech Recognition Models from Encoder-Decoder to LLM Integration

        論文地址:http://arxiv.org/abs/2501.14350

        FireRedASR的卓越性能源于團隊的技術(shù)創(chuàng)新,具體細(xì)節(jié)可參考團隊公開的技術(shù)報告。該模型的開源,無疑將推動語音識別技術(shù)的發(fā)展,并為相關(guān)應(yīng)用帶來更多可能性。


        聯(lián)系作者

        文章來源:機器之心
        作者微信:
        作者簡介:專業(yè)的人工智能媒體和產(chǎn)業(yè)服務(wù)平臺

        閱讀原文
        ? 版權(quán)聲明
        Trae官網(wǎng)

        相關(guān)文章

        Trae官網(wǎng)

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 亚洲AV无码一区二区三区性色 | 黄色网址免费在线| 野花高清在线电影观看免费视频 | 免费吃奶摸下激烈视频| 在线观看亚洲专区| 免费看国产一级片| 一级毛片a免费播放王色电影 | 亚洲专区一路线二| 美女视频黄a视频全免费| 亚洲免费在线视频播放| 男人的好免费观看在线视频| 亚洲AV成人影视在线观看| 四虎永久在线观看免费网站网址 | 亚洲色欲久久久久综合网| 香蕉国产在线观看免费| 国产亚洲精品看片在线观看 | 在线观看人成视频免费无遮挡| 久久精品夜色噜噜亚洲A∨| a级毛片免费全部播放| 久久亚洲精品无码aⅴ大香| 99久久免费国产精品特黄| 亚洲精品国产综合久久久久紧| www.亚洲一区| 精品四虎免费观看国产高清午夜| 激情内射亚洲一区二区三区| 日本视频一区在线观看免费| 亚洲日韩AV一区二区三区四区| 伊在人亚洲香蕉精品区麻豆| 大地资源中文在线观看免费版| 亚洲字幕在线观看| 国产免费资源高清小视频在线观看| 四虎永久在线精品免费一区二区| 好看的电影网站亚洲一区| 在线观看日本免费a∨视频| 国产亚洲人成在线影院| 精品国产_亚洲人成在线高清| 国产va精品免费观看| 一区二区三区免费电影| 亚洲小说图片视频| 亚洲男同帅GAY片在线观看| 成年在线网站免费观看无广告|