<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        Transformer的無限之路:位置編碼視角下的長度外推綜述

        Transformer的無限之路:位置編碼視角下的長度外推綜述

        AIGC動(dòng)態(tài)歡迎閱讀

        原標(biāo)題:Transformer的無限之路:位置編碼視角下的長度外推綜述
        關(guān)鍵字:位置,模型,方法,能力,正弦
        文章來源:機(jī)器之心
        內(nèi)容字?jǐn)?shù):5620字

        內(nèi)容摘要:


        機(jī)器之心專欄
        機(jī)器之心編輯部在自然語言處理(Natural Language Processing,NLP)領(lǐng)域,Transformer 模型因其在序列建模中的卓越性能而受到廣泛關(guān)注。然而,Transformer 及在其基礎(chǔ)之上的大語言模型(Large Language Models,LLMs)都不具備有效長度外推(Length Extrapolation)的能力。這意味著,受限于其訓(xùn)練時(shí)預(yù)設(shè)的上下文長度限制,大模型無法有效處理超過該長度限制的序列。
        文本續(xù)寫和語言延展是人類語言的核心能力之一,與之相對(duì)的,長度外推是語言模型智能進(jìn)化的重要方向,也是在大模型時(shí)代最為高效的將模型的能力遷移到長序列數(shù)據(jù)的重要方法,對(duì)該問題的研究兼具理論價(jià)值和應(yīng)用價(jià)值。因此,大量的相關(guān)工作持續(xù)涌現(xiàn),在不斷擴(kuò)展語言模型能力邊界的同時(shí),也呼喚一篇系統(tǒng)性的綜述來對(duì)這一領(lǐng)域進(jìn)行概覽。
        基于此,哈爾濱工業(yè)大學(xué)的研究者們從位置編碼(Position Encoding, PE)的角度出發(fā),全面地總結(jié)了 Transformer 模型在長度外推方面的研究進(jìn)展,系統(tǒng)地回顧了各種旨在增強(qiáng) Transformer 長度外推能力的方法


        原文鏈接:Transformer的無限之路:位置編碼視角下的長度外推綜述

        聯(lián)系作者

        文章來源:機(jī)器之心
        作者微信:almosthuman2014
        作者簡介:專業(yè)的人工智能媒體和產(chǎn)業(yè)服務(wù)平臺(tái)

        閱讀原文
        ? 版權(quán)聲明
        Trae官網(wǎng)

        相關(guān)文章

        Trae官網(wǎng)

        暫無評(píng)論

        暫無評(píng)論...
        主站蜘蛛池模板: 国产免费AV片在线观看播放| 亚洲大成色www永久网站| 亚洲成a人片在线网站| 99视频在线免费观看| 亚洲国产精品VA在线观看麻豆| 国产免费人成视频尤勿视频 | 亚洲午夜电影在线观看高清| 亚洲最大av无码网址| 亚洲AV无码精品色午夜在线观看| 2022国内精品免费福利视频| 亚洲一级Av无码毛片久久精品| 久久久久久毛片免费看| 国产亚洲高清不卡在线观看| 日本卡1卡2卡三卡免费| 久久精品国产精品亚洲毛片| 久久久久久久免费视频| 亚洲国产高清视频在线观看| 女人张开腿给人桶免费视频| 色费女人18女人毛片免费视频| 亚洲一区二区三区乱码A| 国产成人精品无码免费看| 91亚洲国产成人久久精品| 最新中文字幕免费视频| 男女作爱免费网站| 亚洲产国偷V产偷V自拍色戒| 美女被cao免费看在线看网站| 亚洲AV无码一区二区三区电影 | 久久精品国产99国产精品亚洲| a级成人免费毛片完整版| 中文字幕亚洲色图| 日韩精品视频免费在线观看| 亚美影视免费在线观看| 亚洲色图校园春色| 四虎永久在线精品免费影视| 免费看一区二区三区四区| 久久久久se色偷偷亚洲精品av| 亚洲精品动漫人成3d在线| 69视频在线观看免费| 国产精品亚洲а∨天堂2021| 无码欧精品亚洲日韩一区| 夭天干天天做天天免费看|