<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        微軟清華改進(jìn)Transformer:用降噪耳機(jī)原理升級注意力,一作在線答疑

        AIGC動態(tài)6個月前發(fā)布 量子位
        390 0 0

        微軟清華改進(jìn)Transformer:用降噪耳機(jī)原理升級注意力,一作在線答疑

        AIGC動態(tài)歡迎閱讀

        原標(biāo)題:微軟清華改進(jìn)Transformer:用降噪耳機(jī)原理升級注意力,一作在線答疑
        關(guān)鍵字:注意力,上下文,噪聲,準(zhǔn)確率,模型
        文章來源:量子位
        內(nèi)容字?jǐn)?shù):0字

        內(nèi)容摘要:


        夢晨 發(fā)自 凹非寺量子位 | 公眾號 QbitAITransformer自問世后就大放異彩,但有個小毛病一直沒解決:
        總愛把注意力放在不相關(guān)的內(nèi)容上,也就是信噪比低。
        現(xiàn)在微軟亞研院、清華團(tuán)隊出手,提出全新改進(jìn)版Differential Transformer,專治這個病,引起熱議。
        論文中介紹,整體思路類似差分放大電路或降噪耳機(jī),用兩個信號的差值來濾除共模噪聲。
        具體到在語言模型中,如果句子很長,只有少數(shù)token會真正影響當(dāng)前token的含義。而注意力機(jī)制允許每兩個詞之間產(chǎn)生交互,其中就包含大量噪聲了。
        團(tuán)隊提出的方法是在注意力層中增加一個Softmax,然后兩個Softmax做減法。
        這一減,噪音信息就被大幅抵消,讓注意力更集中在相關(guān)內(nèi)容上。
        語言建模任務(wù)上的一系列實驗結(jié)果顯示,僅需約65%的模型大小或訓(xùn)練tokens,DIFF Transformer就能達(dá)到與傳統(tǒng)Transformer相當(dāng)?shù)男阅堋?br />新架構(gòu)在長上下文建模、關(guān)鍵信息檢索、減少幻覺、提高上下文學(xué)習(xí)能力以及減少激活異常值等各項指標(biāo)中,普遍優(yōu)于Transformer架構(gòu)。
        論文上傳到arXiv平臺后,有不少學(xué)者到彈幕


        原文鏈接:微軟清華改進(jìn)Transformer:用降噪耳機(jī)原理升級注意力,一作在線答疑

        聯(lián)系作者

        文章來源:量子位
        作者微信:
        作者簡介:

        閱讀原文
        ? 版權(quán)聲明
        Trae官網(wǎng)

        相關(guān)文章

        Trae官網(wǎng)

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 99精品视频在线观看免费| 亚洲高清偷拍一区二区三区| 国产特黄一级一片免费| 中文字幕乱码亚洲精品一区| 久久香蕉国产线看观看亚洲片| 国产精品免费_区二区三区观看| 7m凹凸精品分类大全免费| 免费无码H肉动漫在线观看麻豆| 羞羞视频在线免费观看| 亚洲中文字幕久久精品蜜桃 | 亚洲人成网站日本片| 亚洲精品成人网站在线观看 | 一级特黄a免费大片| 国产亚洲精品AAAA片APP| 日韩亚洲国产高清免费视频| 亚洲最大的视频网站| 久久亚洲AV成人出白浆无码国产| 奇米影视亚洲春色| 亚洲精品第一国产综合精品99| 日韩成人免费视频播放| 国外成人免费高清激情视频| 在线看片免费不卡人成视频| 99久久国产热无码精品免费| 18级成人毛片免费观看| 日本一区二区免费看| 人妻免费一区二区三区最新| 国产日韩久久免费影院 | 免费永久在线观看黄网站| 岛国大片免费在线观看| 成人au免费视频影院| 成人免费777777| 夫妻免费无码V看片| 免费理论片51人人看电影| 看全色黄大色大片免费久久| 在线免费观看国产视频| 国产一级淫片视频免费看| 国产一级理论免费版| 亚洲国模精品一区| 国产AV无码专区亚洲AWWW| 亚洲精品国产精品乱码不99 | A片在线免费观看|