<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        多模態大模型學雜了能力反下降?新研究:MoE+通用專家解決沖突

        AIGC動態1年前 (2023)發布 量子位
        890 0 0

        多模態大模型學雜了能力反下降?新研究:MoE+通用專家解決沖突

        AIGC動態歡迎閱讀

        原標題:多模態大模型學雜了能力反下降?新研究:MoE+通用專家解決沖突
        關鍵字:華為,任務,模型,專家,指令
        文章來源:量子位
        內容字數:4906字

        內容摘要:


        港科大&南科大&華為諾亞方舟實驗室量子位 | 公眾號 QbitAI微調,能讓通用大模型更加適配具體的行業應用。
        但現在,研究人員們卻發現:
        對多模態大模型做“多任務指令微調”,大模型可能會“學得多錯得多”,因為不同任務之間的沖突,導致泛化能力下降。
        △多模態指令微調存在任務沖突舉個例子,多模態問答任務可能要求回復盡可能簡潔準確,文檔理解任務卻會反過來要求大模型盡可能詳細地做出描述。
        不同下游任務指令微調數據分布差異較大,導致一個大模型難以在多個下游任務中均達到最優性能。
        如何解決這個問題?
        來自香港科技大學、南方科技大學和華為諾亞方舟實驗室的聯合研究團隊,受MoE(混合專家模型)開源大模型Mixtral-8×7B的啟發,提出利用稀疏專家模型,打造下游任務泛化性能更好、理解能力更強的多模態大模型。
        具體細節,一起來看。
        多模態指令微調存在任務沖突為了驗證多模態指令微調中不同類型任務數據對模型性能的影響,研究人員將數據進行如下劃分:
        VQA(視覺問答):VQAv2、OKVQA、A-OKVQA、OCRVQA,
        Captioning(圖像描述):COCO Caption、Web CapFilt


        原文鏈接:多模態大模型學雜了能力反下降?新研究:MoE+通用專家解決沖突

        聯系作者

        文章來源:量子位
        作者微信:QbitAI
        作者簡介:追蹤人工智能新趨勢,關注科技行業新突破

        閱讀原文
        ? 版權聲明
        Trae官網

        相關文章

        Trae官網

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 午夜色a大片在线观看免费| 亚洲亚洲人成综合网络| 国产免费卡一卡三卡乱码| 黑人大战亚洲人精品一区| 亚洲午夜精品在线| 一级毛片成人免费看a| 91黑丝国产线观看免费| 亚洲欧洲一区二区三区| 亚洲免费视频播放| 国产免费AV片在线播放唯爱网| 亚洲欧洲自拍拍偷精品 美利坚| 黄色a三级免费看| 青青草国产免费久久久下载| 亚洲成AV人片在线观看无| 午夜在线亚洲男人午在线| 青青青国产在线观看免费| 亚洲av无码一区二区三区不卡| 日韩在线观看免费| 午夜老司机免费视频| 国产亚洲女在线线精品| 亚洲精品视频免费| 久久国产精品成人免费| 亚洲精品成人无限看| 免费国产草莓视频在线观看黄| 三年片在线观看免费观看高清电影| 亚洲成色在线影院| 两个人看的www免费| 亚洲美女在线国产| 华人在线精品免费观看| 亚洲乱码卡三乱码新区| 四虎精品亚洲一区二区三区| 亚洲乱码在线观看| 国产免费看JIZZ视频| 黄色毛片免费网站| 亚洲阿v天堂在线| 特级做A爰片毛片免费69| 又硬又粗又长又爽免费看| 香蕉视频在线观看亚洲| 日韩免费一区二区三区| 亚洲AV无码一区二区三区牲色| 免费看片免费播放|