<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        不分割成token,直接從字節(jié)中高效學(xué)習(xí),Mamba原來還能這樣用

        AIGC動態(tài)1年前 (2024)發(fā)布 機器之心
        452 0 0

        不分割成token,直接從字節(jié)中高效學(xué)習(xí),Mamba原來還能這樣用

        AIGC動態(tài)歡迎閱讀

        原標(biāo)題:不分割成token,直接從字節(jié)中高效學(xué)習(xí),Mamba原來還能這樣用
        關(guān)鍵字:模型,字節(jié),序列,時間,建模
        文章來源:機器之心
        內(nèi)容字?jǐn)?shù):6575字

        內(nèi)容摘要:


        機器之心報道
        編輯:張倩給出一句「Hello, world!」你要怎么把它喂給 AI 模型?目前常見的方法是利用某種算法將它分為若干 token,比如 [“Hello”, “,”, “world”, “!”]。模型通過學(xué)習(xí)這些 token 的上下文關(guān)系以及如何組合它們來表示原始文本或預(yù)測下一個 token。但這種方法依賴于有效的 token 分割算法,而且可能無法很好地處理新詞、專有名詞或非標(biāo)準(zhǔn)用法。因此,不少研究者也在嘗試另一種方法:直接讓模型從字節(jié)中學(xué)習(xí)。在 Mamba 問世之后,這條路似乎有希望了。
        在定義語言模型時,通常會使用一種基本分詞方法,把句子分為詞(word)、子詞(subword)或字符(character)。其中,子詞分詞法一直是最受歡迎的選擇,因為它在訓(xùn)練效率和處理詞匯表外單詞的能力之間實現(xiàn)了自然的折中。然而,一些研究指出了子詞分詞法的問題,如對、拼寫和大小寫變化以及形態(tài)變化缺乏穩(wěn)健性。
        因此,有些研究人員另辟蹊徑,采用了一種使用字節(jié)序列的方法,即從原始數(shù)據(jù)到預(yù)測的端到端映射,中間不進行任何分詞。與子詞模型相比,基于字節(jié)級的語言模型能夠更容易地在不同的書寫形


        原文鏈接:不分割成token,直接從字節(jié)中高效學(xué)習(xí),Mamba原來還能這樣用

        聯(lián)系作者

        文章來源:機器之心
        作者微信:almosthuman2014
        作者簡介:專業(yè)的人工智能媒體和產(chǎn)業(yè)服務(wù)平臺

        閱讀原文
        ? 版權(quán)聲明
        Trae官網(wǎng)

        相關(guān)文章

        Trae官網(wǎng)

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 一区二区无码免费视频网站| 久久久受www免费人成| xx视频在线永久免费观看| 亚洲人成网站在线播放影院在线 | 中国在线观看免费国语版| 亚洲欧洲精品在线| 亚洲大片免费观看| 亚洲午夜精品在线| 无码国产精品一区二区免费I6| 亚洲女人18毛片水真多| 在线v片免费观看视频| 成人区精品一区二区不卡亚洲| 嫩草影院在线免费观看| 羞羞视频免费网站入口| 在线观看国产区亚洲一区成人 | 亚洲色一色噜一噜噜噜| a级毛片无码免费真人久久| 亚洲av一综合av一区| 99久久国产免费中文无字幕| 久久亚洲精品无码VA大香大香| aa级一级天堂片免费观看| 亚洲精华国产精华精华液网站| 国产一级高清视频免费看| 国产成人高清精品免费观看| 久久精品国产亚洲av麻| 中文字幕乱码免费视频| 国产亚洲精彩视频| 久久精品国产69国产精品亚洲| 中文字幕免费视频| 久久亚洲欧美国产精品| 亚洲精品自在在线观看| 免费观看激色视频网站bd| 粉色视频成年免费人15次| 亚洲AV无码久久精品成人 | 亚洲av综合色区| 免费国产黄线在线观看| 一区二区视频在线免费观看| 91嫩草私人成人亚洲影院| 国产美女无遮挡免费视频| 久久久久久AV无码免费网站| 亚洲AV电影天堂男人的天堂|