国产精品亚洲mnbav网站_成人午夜亚洲精品无码网站_日韩va亚洲va欧洲va国产_亚洲欧洲精品成人久久曰影片

被忽略的起點?Karpathy揭秘最初的注意力論文被Transformer光芒掩蓋的故事

AIGC動態1年前 (2024)發布 機器之心
245 0 0

機器之心報道編輯:Panda幾個小時前,著名 AI 研究者、OpenAI 創始成員之一 Andrej Karpathy 發布了一篇備受關注的長推文,其中分享了注意力機制背后一些或許少有人知的故事。其中最值得注意的一個故事是真正首次提出注意力機制的論文其實是 Dzmitry Bahdanau、Kyunghyun Cho 和 Yoshua Bengio 的《Neural Machine Translation by Jointly Learning to Align and Translate》,這比《Attention is All you Need》還早 3 年,但很顯然,這篇論文并沒有收獲后者那般的關注。Karpathy 長推文的不完整截圖實際上,這個故事來自 Dzmitry Bahdanau 發給 Karpathy 的一封郵件。Bahdanau 是 ServiceNow Research 的研究科學家和研究負責人以及麥吉爾大學兼職教授。他在發給 Karpathy 的這封郵件中分享了自己發現注意力機制的旅程以及 Attention 這個術語的由來——其實來自 Yoshua Bengio。此外,他也提到了 Alex Graves 的 NMT 論文和 Jason Weston 的記憶網絡(Memory Networks)論文各自發現類似機制的故事。Karpathy 推文發布后反響熱烈,短時間內就已有超過 20 萬閱讀量,很多讀者都被這個注意力背后的故事吸引。有讀者在看過這個故事后發出感嘆:2013-2017 年間的深度學習宇宙中有很多隱藏的英雄。也有人分享自己對注意力機制的看法。Hyperbolic Labs 創始人和 CTO Yuchen Jin 更是打趣說《Attention Is All You Need》的另一項重要貢獻是將后面的 AI 論文標題帶歪了:「吸引注意力的標題才是 All You Need」。注意力機制的背后故事下面我們就來看看 Karpathy 的推文究竟說了什么:「attention」算子——也就是提出了 Transformer 的《Attention is All you Need》中的那個注意力,背后的(真實)開發和靈感故事。來自大約 2 年前與作者 @DBahdanau 的個人電子郵件通信,在此發布(經許可)。此前幾天,網上流傳著一些關于其開發過程的假新聞。Attention 是一種出色的(數據依賴型)加權平均運算。它是一種形式的全局池化、歸約、通信。它是一種從多個節點(token、圖塊等)聚合相關信息的方法。它富有表現力、功能強大、具有足夠的并行性,并且可以高效優化。甚至多層感知器(MLP)實際上也可以大致重寫為數據型權重上的 Attention(第一層權重是查詢,第二層權重是值,鍵就是輸入,softmax 變為元素級,刪除了規范化)。簡單來說,注意力非常棒,是神經網絡架構設計中的重大突破。《Attention is All You Need》獲得的…… 呃…… 注意力差不多是 3 年前真正提出 Attention 的論文的 100 倍,即 Dzmitry Bahdanau、Kyunghyun Cho 和 Yoshua Bengio 的論文《Neural Machine Translation by Jointly Learning to Align and Translate》。在我看來,這一直有點出人意料。顧名思義,《Attention is All You Need》的核心貢獻是提出:Transformer 神經網絡就是刪除注意力之外的一切,然后基本上就是將其堆疊在帶有 MLP(根據上述內容,這也可以大致被視為注意力)的 ResNet 中。但我確實認為這篇 Transformer 論文有自己獨特的價值,因為它一次性添加了其它許多令人驚嘆的想法,包括位置編碼、縮放式注意力、多頭注意力、各向同性的簡單設計等。在我看來,直到今天(大約 7 年過去了),Transformer 基本上還保持著 2017 年的形式,只有相對較少的微小修改,也許除了使用更好的位置編碼方案(RoPE 等)。總之,我先把完整郵件貼在下面,其中也暗示了這個運算一開始被稱為 Attention 的原因 —— 它源自對源句子中詞的關注(attending)并同時以順序方式輸出翻譯結果的詞,并且之后 Yoshua Bengio 在 RNNSearch 中將其引入成了一個術語(感謝上帝?:D)。同樣有趣的是,該設計的靈感來自人類的認知過程/策略,即按順序來回關注一些數據。最后,從發展進步的本質來看,這個故事相當有趣——類似的想法和表述「早就已經在空氣中回蕩」,特別要提到當時 Alex Graves(NMT)和 Jason Weston(記憶網絡)的工作。謝謝你的故事 @DBahdanau !之后,Karpathy 還做了一些補充:ChatGPT 以及絕大多數現代 AI 模型都是巨型 Transformer。「所以 LLM 的核心神奇之處來自于反復應用注意力,一遍又一遍地關注輸入的 token,以預測下一個 token 是什么。」Dzmitry Bahdanau 的原始郵件內容Karpathy 也一并分享了 Dzmitry Bahdanau 的原始郵件內容:嗨,Andrej,很高興告訴你 8 年前發生的故事!我在雅各布大學 Herbert Jaeger 的指導下完成碩士課程的第一年后,作為實習生來到了 Yoshua 的實驗室。我告訴 Yoshua 我很樂意做任何事情。Yoshua 讓我參與機器翻譯項目,與 Kyunghyun Cho 和團隊一起工作。我當時非常懷疑將詞序列塞入向量的想法。但我也非常想獲得博士學位。所以我擼起袖子,開始做我擅長的事情——編寫代碼、修復錯誤等等。在某個時候,我表現得很了解我做的東西了,Yoshua 邀請我攻讀博士學位(2014 年是一個很好的時機,表現得很了解就已經足夠了——美好的舊時光!)。我非常高興,我認為可以開始享受樂趣并發揮創造力了。所以我開始思考如何避免編碼器和解碼器 RNN 之間的瓶頸。我的第一個想法是構建一個帶有兩個「光標」的模型,一個在源序列中移動(由一個 BiRNN 編碼),另一個在目標序列中移動。使用動態規劃(dynamic programming)可以將光標軌跡邊緣化。KyungHyun Cho 認為這相當于 Alex Graves 的 RNN Transducer 模型。之后,我可能還讀了 Graves 的手寫識別論文。不過,這種方法看起來不適合機器翻譯。在我實習的剩余 5 周內,上述使用光標的方法很難實現。所以我嘗試了一種更簡單的方法——兩個光標同時同步移動(實際上是硬編碼的對角注意力)。這種方法有點效果,但方法不夠優雅。所以有一天,我想到如果能讓解碼器 RNN 學會在源序列中搜索放置光標的位置就好了。這多少受到我中學時學習英語時的翻譯練習的啟發。翻譯時,你的目光會在源序列和目標序列之間來回移動。我將這種軟性搜索表示為 softmax,然后對 BiRNN 狀態進行加權平均。它的效果很好,從第一次嘗試,到后來振奮人心。我將這個架構稱為 RNNSearch,我們急于發表一篇 arXiv 論文,因為我們知道谷歌的 Ilya 和同事領先于我們,他們有巨大的 8 GPU LSTM 模型(而 RNN Search 仍在 1 GPU 上運行)。后來發現,這個名字并不好。直到最后幾次過論文時,Yoshua 才將更好的名字(attention)添加到論文結論中。一個半月后,我們看到了 Alex Graves 的 NMT 論文。這確實是完全相同的想法,盡管他提出它的動機完全不同。在我們的情況下,是因為需要而產生了這個發明。在他的情況下,我想應該是將神經和符號 AI 連接起來的雄心吧?Jason Weston 及其同事的記憶網絡論文也采用了類似的機制。我沒有遠見地想到注意力可以在較低的層級使用,以作為表征學習的核心運算。但是當我看到 Transformer 論文時,我立即向實驗室同事斷言 RNN 已死。回到你最初的問題:在蒙特利爾 Yoshua 的實驗室發明的「可微分和數據依賴加權平均」于神經圖靈機、記憶網絡以及 90 年代(甚至 70 年代)的一些相關認知科學論文。這是 Yoshua 領導推動實驗室進行雄心勃勃的研究的結果,KyungHyun Cho 在運行一個大型機器翻譯項目方面擁有高超的技能,該項目由初級博士生和實習生組成;最后,我自己的創造力和編碼技能在多年的競爭性編程中得到了磨練。但我認為這個想法很快就會被發現。就算我、Alex Graves 和這個故事中的其他角色當時沒有研究深度學習也是如此,注意力就是深度學習中實現靈活空間連接的自然方式。等待 GPU 足夠快,讓人們有動力認真對待深度學習研究,這是一個顯而易見的想法。自從我意識到這一點以來,我在 AI 領域的抱負就是啟動像機器翻譯項目這樣的出色的應用項目。相比于那些研究所謂的「真正」AI 的花哨理論,良好的研發工作可以為基礎技術的進步做出更大貢獻。就這些!我非常想更多了解關于您的教育 AI 項目的信息(我從 Harm de Vries 那里聽到了一些傳言;))。祝好,Dima相關論文最后,下面梳理了前面提及的相關論文,以幫助感興趣的讀者做進一步的技術探索。Neural Machine Translation by Jointly Learning to Align and Translate,未得到應有關注的注意力論文作者:Dzmitry Bahdanau, Kyunghyun Cho, Yoshua Bengio鏈接:https://arxiv.org/abs/1409.0473Attention is All You Need,著名的 Transformer 論文作者:Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N. Gomez, Lukasz Kaiser, Illia Polosukhin鏈接:https://arxiv.org/abs/1706.03762Neural Turing Machines,其中幾乎同時提出了類似的 soft pooling 運算作者:Alex Graves, Greg Wayne, Ivo Danihelka鏈接:https://arxiv.org/abs/1410.5401Generating Sequences With Recurrent Neural Networks,研究了使用 LTSM 循環神經網絡生成具有長程結構的復雜序列,很有開創性作者:Alex Graves鏈接:https://arxiv.org/abs/1308.0850Memory Networks,記憶網絡作者:Jason Weston, Sumit Chopra, Antoine Bordes鏈接:https://arxiv.org/abs/1410.3916Sequence to Sequence Learning with Neural Networks,文中提到的當時在谷歌的 Ilya 等人的論文作者:Ilya Sutskever, Oriol Vinyals, Quoc V. Le鏈接:https://arxiv.org/abs/1409.3215參考鏈接https://x.com/karpathy/status/1864023344435380613https://x.com/karpathy/status/18640300164573759162024亞馬遜云科技 re:lnvent 《拉斯維加斯有約》直擊現場——Swami Sivasubramanian 博士主題演講中文解讀第一時間深度解讀亞馬遜云科技2024年re:Invent 年度盛會!了解亞馬遜云科技獨樹一幟的創新實踐與文化和全系列前沿解決方案、如何開拓創新并引領全球云計算的全方位發展、如何重構基礎架構并打造全新體驗,探索如何依托強大的數據基礎為客戶打造創新的、差異化的解決方案。聆聽客戶發言人分享真實案例,了解如何利用數據支持包括生成式 AI 在內的各種應用場景,進而打造獨一無二的客戶體驗。分享亞馬遜云科技及其合作伙伴為客戶帶來的積極變革,賦能其重塑商業模式、取得非凡成就。這不僅是一場深入了解前沿技術、數據應用和創新實踐的盛會,更是一個不容錯過的交流平臺。期待您的加入!?THE END轉載請聯系本公眾號獲得授權投稿或尋求報道:liyazhou@jiqizhixin.com

閱讀原文
? 版權聲明
蟬鏡AI數字人

相關文章

蟬鏡AI數字人

暫無評論

暫無評論...
国产精品亚洲mnbav网站_成人午夜亚洲精品无码网站_日韩va亚洲va欧洲va国产_亚洲欧洲精品成人久久曰影片
<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        久久天堂av综合合色| 国产精品 日产精品 欧美精品| 欧美日韩国产123| 亚洲91在线| 精品福利av导航| 久久午夜精品视频| 日韩欧美极品在线观看| 国产精品熟女一区二区不卡| 亚洲一区电影777| 欧美性受xxxxxx黑人xyx性爽| 男人的天堂av网| 亚洲午夜成aⅴ人片| 精品久久久噜噜噜噜久久图片| 国产精品乱码妇女bbbb| 日本在线xxx| а天堂中文最新一区二区三区| 日韩av影片在线观看| www.色小姐com| 亚洲网址你懂得| 成人知道污网站| 欧美极品美女电影一区| 日韩系列欧美系列| 国产精品一二三视频| 亚洲一区一卡| 欧美精品久久久| 国产成人av电影在线播放| 大桥未久一区二区| 最近中文字幕一区二区三区| 香港日本韩国三级网站| 欧美性开放视频| 国产传媒视频在线 | 亚洲精品一二三| 日本中文字幕精品—区二区| 色一区在线观看| 人人妻人人澡人人爽人人精品| 欧美另类变人与禽xxxxx| 在线观看黄网址| 美女国内精品自产拍在线播放| 日产午夜精品一线二线三线| 91系列在线观看| 国产传媒欧美日韩成人| 无罩大乳的熟妇正在播放| 婷婷中文字幕综合| 91麻豆制片厂| 久久久久久国产三级电影| 日韩一区二区免费看| 色一情一乱一伦一区二区三欧美| 久久久www免费人成精品| 亚洲视频一二三四| 欧美成人国产一区二区| 亚洲精品**不卡在线播he| 91老司机精品视频| 91蜜桃在线观看| 黑人性生活视频| 亚洲精品综合精品自拍| 日韩伦理一区| 鲁鲁狠狠狠7777一区二区| 国产视频不卡一区| 在线观看国产网站| 久久久久www| 亚洲欧美日本国产专区一区| 日韩一区二区高清视频| 懂色av一区二区三区| 麻豆精品一区二区三区视频| 97精品国产97久久久久久免费 | 欧美综合影院| 久久免费成人精品视频| 秋霞国产午夜精品免费视频| 男人操女人免费软件| 欧美一区二区三区影视| 欧美欧美黄在线二区| 国产在线播放一区二区| 国产精品美女久久久久aⅴ| 免费观看一级一片| 欧美激情在线视频二区| 精品影院一区二区久久久| 激情视频免费网站| 亚洲欧美一区二区三区久久| 午夜精品偷拍| 可以看毛片的网址| 欧美成人r级一区二区三区| 999成人网| 日韩 欧美 自拍| 欧美日韩国产高清一区| 精品影片在线观看的网站| 欧洲一区二区在线| 欧美在线免费播放| 国产精品一线天粉嫩av| 亚洲资源视频| 337p亚洲精品色噜噜| 日韩欧美电影| 波多野结衣av一区二区全免费观看 | 亚洲成色777777女色窝| 欧美日韩1区| 国产日产欧美视频| 国产一区二区美女视频| 日本欧美在线观看| 国产69视频在线观看| 亚州精品天堂中文字幕| 91农村精品一区二区在线| 天天干天天操天天拍| 国产精品999| 亚洲欧洲日韩在线| 亚洲三级av| 日本一区二区在线| 777亚洲妇女| 亚洲精品系列| 国内国产精品天干天干| 精品国产自在精品国产浪潮| 国产成人在线免费| 国产精品www爽爽爽| 91嫩草免费看| 欧洲国内综合视频| 亚洲欧美亚洲| 免费网站在线观看黄| 欧美另类交人妖| 久久亚洲免费视频| av日韩在线免费观看| 欧美日本亚洲| 亚洲第一区第二区| 韩国理伦片一区二区三区在线播放| 色综合久久五月| 成人激情免费在线| 在线观看不卡视频| 韩国久久久久| 99热超碰在线| 91视频88av| 欧美三级韩国三级日本一级| 最新亚洲视频| 2一3sex性hd| 国产精品二区三区| 91精品国产福利| 奇米影视7777精品一区二区| 国产精品成人无码免费| 精品欧美日韩| 亚洲激情小视频| 岛国av在线一区| 国产在线不卡一区二区三区| 亚洲区成人777777精品| 视频在线观看99| 久久精品人人做人人综合| 欧美变态网站| 欧美精品aaaa| 国产精品老女人视频| 91国在线观看| 日本不卡一区二区| 日韩电影免费观看高清完整版在线观看| 视频一区国产精品| 自拍偷拍免费精品| 亚洲视频免费观看| 伊人久久婷婷| www.黄色在线| 国产av第一区| 欧美激情综合色| 日韩欧美在线视频免费观看| 久久婷婷影院| 中日韩一级黄色片| www.avtt| 国产精品福利无圣光在线一区| 色爱区综合激月婷婷| 久久成人免费电影| 国产96在线亚洲| 亚洲高清免费在线观看| 91老司机在线| 国产丝袜精品第一页| 国产喂奶挤奶一区二区三区| 欧美日韩精品在线一区| 东京热av一区| 亚洲视频电影| 久久人人97超碰精品888| 色综合久久99| 丰满白嫩尤物一区二区| 你微笑时很美电视剧整集高清不卡 | 天天影视网天天综合色在线播放| 伊人久久久大香线蕉综合直播| 日本爱爱爱视频| 日韩一级特黄毛片| 国产精品91视频| 精品99一区二区| 国产精品嫩草影院com| 欧美三级视频| 色999韩欧美国产综合俺来也| 国产极品在线视频| 国产噜噜噜噜噜久久久久久久久 | 在线播放国产一区二区三区| 国产精品久久夜| 亚洲美女少妇无套啪啪呻吟| 永久久久久久久| 成人在线观看黄| 国产精品国产一区二区| 一区二区三区动漫| 色综合久久中文综合久久97| 国产乱国产乱300精品| 九九热爱视频精品视频| 右手影院亚洲欧美| 免费一级特黄毛片| 不卡视频一区| 欧美激情第99页| 69久久夜色精品国产69蝌蚪网| 99国产精品久久久久| 久久久久国产| 96sao精品免费视频观看| 亚洲无在线观看| 日本三级中文字幕在线观看| 91精品视频播放| 久久九九热免费视频| 欧美一区二区三区在线观看视频| 国产精品乱码人人做人人爱 | 久久久亚洲综合| 三级亚洲高清视频| 91免费精品| 亚洲一区二区三区中文字幕在线观看 | 91探花福利精品国产自产在线| 啊v视频在线一区二区三区| 欧美三级韩国三级日本三斤| 国产日韩精品久久久| 蜜桃视频第一区免费观看| 国产日韩第一页| 成人国产精品av| 欧美大片在线看| 亚洲电影免费观看高清| 色综合色狠狠综合色| 国产精品色在线| 国产成人欧美日韩在线电影| 亚洲二区精品| 欧美日韩黑人| 99re91这里只有精品| 国产又粗又黄又猛| 日韩大尺度视频| 日本成人黄色网| 日b视频免费观看| 日本成人看片网址| 亚洲xxx自由成熟| 国产精品成人免费电影| 九九精品视频在线观看| 日韩风俗一区 二区| 欧美日本在线观看| 色婷婷精品久久二区二区蜜臀av| 国产精品久线在线观看| 久久久噜噜噜久噜久久综合| 国产成人亚洲综合色影视| 视频在线在亚洲| 亚洲精品人人| 亚洲一级影院| 天天久久综合| 日韩精品一区二区久久| 欧美人妖在线观看| 91亚洲无吗| 亚洲国产中文在线| 高清一区二区| 成人在线啊v| 性欧美videos| 五月天婷婷色综合| 91精品国产闺蜜国产在线闺蜜| 瑟瑟视频在线观看| 网站免费在线观看| 一本色道久久综合亚洲精品图片| 国产精品熟妇一区二区三区四区| 毛片毛片毛片毛片毛| 亚洲精品久久久中文字幕| 免费观看精品视频| 少妇高清精品毛片在线视频| 131美女爱做视频| av在线播放亚洲| 国产主播在线看| 欧美伦理视频在线观看| aaa毛片在线观看| 亚洲xxxx2d动漫1| 在线免费观看av的网站| 久久婷婷国产91天堂综合精品| www日韩视频| 国产日韩成人内射视频| 色www免费视频| 日本美女久久久| 国产精品久久久久久亚洲av| 一起草在线视频| 免费视频91蜜桃| 日韩黄色三级在线观看| 国产一区二区三区免费在线| 国产精品久久久久av蜜臀| 亲子伦视频一区二区三区| 欧美日韩性在线观看| 久久久久久久久久久久久久久久久久| 午夜久久福利| 久久青草久久| 国产精品888| 久久人人97超碰com| 中文字幕一区二区三区四区不卡| 亚洲一区二区三区在线| 色久综合一二码| 日韩精品资源二区在线| 日本美女视频一区二区| 岛国av在线一区| 国产精品白丝在线| 精品久久久久久亚洲国产300| 欧美精选午夜久久久乱码6080| 欧美成人猛片aaaaaaa| 中文一区二区视频| 茄子视频成人在线| 99精品国产一区二区| 亚洲精品一品区二品区三品区| 免费看欧美一级片| 鲁一鲁一鲁一鲁一av| 一级黄色片大全| 57pao国产一区二区| 欧美电影免费观看高清| 肉色丝袜一区二区| 91免费视频网址| 精品久久久中文| 精品国产91洋老外米糕| 久久91精品国产91久久久| 91精品在线观| 最近看过的日韩成人| 天天干在线影院| 天天操天天舔天天射| 久久国产精品免费精品3p| 国产精品激情电影| 国产98色在线|日韩| 亚洲一区免费视频| 亚洲第一网站免费视频| 97视频在线观看亚洲| 国模精品娜娜一二三区| 日韩国产一级片| 韩国无码一区二区三区精品| 日本一区二区三区电影免费观看| 99久久婷婷| 国产精品综合网| 亚洲国产成人av网| 日韩经典第一页| 国产福利视频一区| 一区二区三区四区国产| 日韩av影视大全| 婷婷视频一区二区三区| 国产欧美欧美| 国产精品麻豆视频| 日韩免费高清av| 欧美最近摘花xxxx摘花| 日本最新一区二区三区视频观看| 日本成人在线免费视频| 少妇高潮在线观看| 欧美国产免费| 97成人超碰视| 91精品国产免费久久综合| 欧美激情aaaa| 亚洲精品高清视频| 国产精品一区二区在线免费观看| 亚洲日本一区二区三区在线| 日韩精品三区四区| 亚洲免费观看高清完整版在线 | 国产一区二区三区网站| 成人免费直播live| 国产一区二区在线视频播放| 免费一级特黄3大片视频| 国产亚洲精品网站| 国产一二三四区在线| 91精品国产成人观看| 久久综合久久鬼色中文字| 91精品国产综合久久国产大片| 欧美孕妇与黑人孕交| 免费在线精品视频| 5566中文字幕| 亚洲一区国产| 亚洲国产精品久久久久秋霞影院| 久久视频在线直播| 五月天综合网| 九九九视频在线观看| 亚洲电影在线| 亚洲狠狠爱一区二区三区| 日韩有码在线电影| 日韩av电影免费在线| 日韩免费高清一区二区| 97精品一区| 亚洲日本在线看| 在线国产精品播放| 午夜老司机精品| 国产又粗又猛又爽又黄av | 韩国精品一区二区三区| 中文字幕亚洲精品在线观看| 亚洲一二在线观看| 欧美精品在线一区| 草草地址线路①屁屁影院成人| 天天射天天综合网| 2021中文字幕一区亚洲| 亚洲乱亚洲乱妇无码| 日韩国产在线一区| 成人无码av片在线观看| 翔田千里一区二区| 在线看日本不卡| 成人高清视频观看www| 国产ts在线观看| 亚洲成人资源| 在线观看中文字幕不卡| 国产欧美一区二区| 深夜福利网站在线观看| 欧美激情偷拍| 高跟丝袜欧美一区| 91精品国产综合久久久久久久久 | 国产免费一区二区三区网站免费| 99精品久久久| 91久久免费观看|