<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        ViT作者飛機上也要讀的改進版Transformer論文,花2個小時詳細批注解讀分享出來

        AIGC動態9個月前發布 量子位
        354 0 0

        質疑微軟,理解微軟

        ViT作者飛機上也要讀的改進版Transformer論文,花2個小時詳細批注解讀分享出來

        原標題:ViT作者飛機上也要讀的改進版Transformer論文,花2個小時詳細批注解讀分享出來
        文章來源:量子位
        內容字數:3875字

        Lucas Beyer點評微軟Differencial Transformer論文:改進Transformer架構的“簡單而優雅”嘗試

        近日,OpenAI研究員Lucas Beyer在其個人社交媒體上發表長文,對一篇來自微軟的改進Transformer架構的論文(簡稱DiffTransformer)進行了深入分析。這篇論文提出了一種名為“Differencial Transformer”的模型,旨在解決Transformer模型信噪比低的問題,其核心思想類似于差分放大電路或降噪耳機,利用兩個注意力頭的差值來濾除共模噪聲。

        1. 論文核心思想及Beyer的初步質疑

        論文的核心創新點可以用一句話概括:將兩個注意力頭配對,然后執行(softmax(Q1K1) – λ*softmax(Q2K2)) V,其中λ是一個可學習的標量。 Beyer最初對該方法持保留態度,認為普通的Transformer的多個注意力頭應該能夠自行學習到這種機制,無需額外設計。

        2. Beyer的觀點轉變及論文細節分析

        然而,在與同行交流并重新閱讀論文后,Beyer改變了看法。他贊揚了論文中實驗的公平性和謹慎性。但他同時指出了一些論文中容易被忽視的細節,例如:DiffAttn實際上并沒有對差值重新歸一化,λ的計算較為復雜,且缺乏對λ參數的深入分析,以及實驗中基線模型選擇的合理性存疑等。 Beyer建議論文作者提供更多關于注意力分布、熵、以及λ參數和層歸一化影響的圖表數據,以增強論文的說服力。

        3. 實驗結果及Beyer的質疑

        論文中大量的實驗結果顯示,Diff Transformer在某些方面表現優于基線模型StableLM-3B。然而,Beyer對實驗結果提出了兩點質疑:首先,縮放曲線存在明顯的斷裂,且使用了不同的學習率;其次,訓練數據量相對較小(100億token)。他認為這些因素可能影響了實驗結果的可靠性,并建議提供基于計算量或實際時間的縮放曲線。

        4. Diff Transformer的優勢及不足

        盡管存在一些質疑,Beyer仍然肯定了Diff Transformer在長文本評測和對輸入樣本順序的魯棒性方面的優勢。特別是在上下文學習的魯棒性實驗中,Diff Transformer表現出更強的穩定性。但同時,Diff Transformer的推理速度略慢于基線模型(慢5-10%)。

        5. 總結與展望

        總而言之,Beyer對Diff Transformer的評價是積極的,他認為這項工作展現了比單純的“兩個注意力頭相減”更多的潛力,是一個有前景的研究方向。但他同時也強調,需要進一步的研究來驗證其在其他任務中的泛化能力和復現性。

        6. 關于作者Lucas Beyer

        Lucas Beyer是OpenAI的研究員,曾是谷歌的研究員,參與了Vision Transformer的研發。他經常對最新的AI研究發表評論,是一位值得關注的學者。


        聯系作者

        文章來源:量子位
        作者微信:
        作者簡介:追蹤人工智能新趨勢,關注科技行業新突破

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 国产精品无码永久免费888 | 国产免费AV片在线播放唯爱网 | 午夜一级免费视频| 亚洲国产中文v高清在线观看| 亚洲日韩精品射精日| 国产精品亚洲片在线va| 黄色视频在线免费观看| 成年女人18级毛片毛片免费| 天堂亚洲免费视频| 亚洲国产综合人成综合网站00| 一级视频免费观看| 大学生高清一级毛片免费| 国产亚洲免费的视频看| 看Aⅴ免费毛片手机播放| 最近中文字幕免费2019| 国产亚洲av片在线观看18女人| 亚洲精品第一综合99久久| 国产三级在线免费| yy6080久久亚洲精品| 日韩免费在线中文字幕| 成年女性特黄午夜视频免费看| 亚洲精品综合在线影院| 青青草国产免费久久久91| 日韩毛片一区视频免费| 免费国产精品视频| 亚洲中文字幕无码中文字| 91成人免费观看| 久久亚洲国产成人影院| 国产精品久久久久影院免费| 亚洲伊人久久大香线蕉AV| 国产在线19禁免费观看国产| 成av免费大片黄在线观看| 亚洲av日韩av欧v在线天堂| 中文字幕av免费专区| 亚洲永久中文字幕在线| 久久久精品2019免费观看 | 4480yy私人影院亚洲| 久久福利青草精品资源站免费| 亚洲成a人片在线观看中文app| 在线观看国产情趣免费视频| 亚洲乱色熟女一区二区三区蜜臀|