<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        混合專家系統(tǒng)里根本沒專家?開源MoE模型論文引網(wǎng)友熱議

        AIGC動態(tài)1年前 (2024)發(fā)布 量子位
        526 0 0

        混合專家系統(tǒng)里根本沒專家?開源MoE模型論文引網(wǎng)友熱議

        AIGC動態(tài)歡迎閱讀

        原標題:混合專家系統(tǒng)里根本沒專家?開源MoE模型論文引網(wǎng)友熱議
        關鍵字:專家,論文,領域,模型,發(fā)現(xiàn)
        文章來源:量子位
        內(nèi)容字數(shù):2455字

        內(nèi)容摘要:


        克雷西 發(fā)自 凹非寺量子位 | 公眾號 QbitAI紅極一時的開源MoE模型Mixtral,論文終于新鮮出爐!
        除了披露了更多技術細節(jié),論文中還有一個結論引發(fā)了熱烈討論——
        研究人員本想研究Mixtral是怎么根據(jù)話題分配專家的,結果發(fā)現(xiàn)專家的分配……和話題好像沒什么關系。
        而在大多數(shù)人的印象中,Mixtral里的8個專家,是分別負責處理不同領域的話題的……
        論文的結論曝光后,不少網(wǎng)友開始認為“專家混合”這個說法,可能不那么貼切了:
        于是,針對Mixtral真實的工作機制,有網(wǎng)友給出了這樣的比喻:
        所以,比起“專家的組合”,這樣的工作方式更像是一種硬盤陣列或者負載均衡?
        但也有網(wǎng)友表示了不同意見:
        這個問題并不根屬于MoE,因為自己之前見過的MoE模型中,是發(fā)現(xiàn)了真·專家分工的現(xiàn)象的。
        那么,這究竟是怎么一回事呢?
        實驗未發(fā)現(xiàn)專家按領域分布在訓練過程中,作者觀察了Mixtral中是否有一些專家會針對某些特定領域進行專門化。
        具體來說,作者計算了第0、15、31層在The Pile驗證集的不同子集(包含不同領域的文檔)上被選中的專家分布。
        這些子集包括LaTeX格式的arXiv論文、生物


        原文鏈接:混合專家系統(tǒng)里根本沒專家?開源MoE模型論文引網(wǎng)友熱議

        聯(lián)系作者

        文章來源:量子位
        作者微信:QbitAI
        作者簡介:追蹤人工智能新趨勢,關注科技行業(yè)新突破

        閱讀原文
        ? 版權聲明
        Trae官網(wǎng)

        相關文章

        Trae官網(wǎng)

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 亚洲日韩v无码中文字幕| 麻豆国产入口在线观看免费| 亚洲欧洲美洲无码精品VA| 亚洲欧美日韩中文高清www777| 国产大片线上免费观看| 亚洲福利一区二区| 精品无码无人网站免费视频| 无码久久精品国产亚洲Av影片| 免费人成激情视频在线观看冫 | 九九免费久久这里有精品23| 国产伦一区二区三区免费 | 欧洲乱码伦视频免费| 亚洲国产品综合人成综合网站| 成人黄色免费网站| 亚洲 暴爽 AV人人爽日日碰| 免费看少妇作爱视频| 亚洲av永久中文无码精品 | 国产麻豆成人传媒免费观看| 亚洲国产第一页www| 亚洲精品国产免费| 亚洲熟妇AV日韩熟妇在线| 在线看片无码永久免费aⅴ | 永久免费视频v片www| 国产成人不卡亚洲精品91| 亚洲精品麻豆av| 久草福利资源网站免费| 亚洲国产精品成人久久久| 午夜私人影院免费体验区| 免费的黄色网页在线免费观看| 亚洲日韩精品一区二区三区无码 | 四色在线精品免费观看| 免费无码一区二区| 无码乱人伦一区二区亚洲| 成人毛片18女人毛片免费视频未| 国产亚洲精品91| 亚洲日本精品一区二区| 成人最新午夜免费视频| 国产线视频精品免费观看视频| 亚洲第一页在线播放| 在线a亚洲v天堂网2018| 最近中文字幕完整版免费高清|