<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        Transformer本可以深謀遠慮,但就是不做

        AIGC動態(tài)1年前 (2024)發(fā)布 機器之心
        455 0 0

        Transformer本可以深謀遠慮,但就是不做

        AIGC動態(tài)歡迎閱讀

        原標題:Transformer本可以深謀遠慮,但就是不做
        關鍵字:模型,語言,緩存,步驟,面包屑
        文章來源:機器之心
        內(nèi)容字數(shù):3851字

        內(nèi)容摘要:


        機器之心報道
        機器之心編輯部語言模型是否會規(guī)劃未來 token?這篇論文給你答案。
        「別讓 Yann LeCun 看見了。」Yann LeCun 表示太遲了,他已經(jīng)看到了。今天要介紹的這篇 「LeCun 非要看」的論文探討的問題是:Transformer 是深謀遠慮的語言模型嗎?當它在某個位置執(zhí)行推理時,它會預先考慮后面的位置嗎?
        這項研究得出的結論是:Transformer 有能力這樣做,但在實踐中不會這樣做。
        我們都知道,人類會思而后言。數(shù)十年的語言學研究表明:人類在使用語言時,內(nèi)心會預測即將出現(xiàn)的語言輸入、詞或句子。
        不同于人類,現(xiàn)在的語言模型在「說話」時會為每個 token 分配固定的計算量。那么我們不禁要問:語言模型會和人類一樣預先性地思考嗎?
        近期的一些研究已經(jīng)表明:可以通過探查語言模型的隱藏狀態(tài)來預測下一 token 之后的更多 token。有趣的是,通過在模型隱藏狀態(tài)上使用線性探針,可以在一定程度上預測模型在未來 token 上的輸出,而干擾隱藏狀態(tài)則可以對未來輸出進行可預測的修改。
        這些發(fā)現(xiàn)表明在給定時間步驟的模型激活至少在一定程度上可以預測未來輸出。
        但是,我們還不


        原文鏈接:Transformer本可以深謀遠慮,但就是不做

        聯(lián)系作者

        文章來源:機器之心
        作者微信:almosthuman2014
        作者簡介:專業(yè)的人工智能媒體和產(chǎn)業(yè)服務平臺

        閱讀原文
        ? 版權聲明
        蟬鏡AI數(shù)字人

        相關文章

        蟬鏡AI數(shù)字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 1000部国产成人免费视频| 亚洲AV女人18毛片水真多| 怡红院免费的全部视频| 亚洲精品无码久久毛片| 免费精品视频在线| 亚洲女人被黑人巨大进入| 特级毛片A级毛片100免费播放| 成年人网站在线免费观看| 亚洲最大中文字幕无码网站 | 亚洲第一AAAAA片| 久久精品成人免费网站| 久久国产亚洲精品无码| 亚洲精品在线免费观看视频| 亚洲成a人片毛片在线| 青春禁区视频在线观看直播免费| 一区二区亚洲精品精华液| 免费一级一片一毛片| v片免费在线观看| 亚洲国产成人高清在线观看| 84pao国产成视频免费播放| 国产成人精品亚洲2020| 国产无遮挡吃胸膜奶免费看视频| 亚洲爆乳无码专区www| 手机看片久久国产免费| 黄色免费网址在线观看| 久久精品国产精品亚洲艾草网| 永久免费视频网站在线观看| 亚洲精品乱码久久久久久V | 免费人成动漫在线播放r18 | 暖暖免费高清日本中文| 一级毛片成人免费看a| 久久久久亚洲精品天堂| 午夜免费福利影院| a在线观看免费网址大全| 亚洲剧场午夜在线观看| 亚洲精品无码av天堂| 国产成人精品久久免费动漫| 免费看一级高潮毛片| 亚洲码在线中文在线观看| 国产人成免费视频| 99re免费视频|