<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        多模態大模型學雜了能力反下降?新研究:MoE+通用專家解決沖突

        AIGC動態1年前 (2023)發布 量子位
        890 0 0

        多模態大模型學雜了能力反下降?新研究:MoE+通用專家解決沖突

        AIGC動態歡迎閱讀

        原標題:多模態大模型學雜了能力反下降?新研究:MoE+通用專家解決沖突
        關鍵字:華為,任務,模型,專家,指令
        文章來源:量子位
        內容字數:4906字

        內容摘要:


        港科大&南科大&華為諾亞方舟實驗室量子位 | 公眾號 QbitAI微調,能讓通用大模型更加適配具體的行業應用。
        但現在,研究人員們卻發現:
        對多模態大模型做“多任務指令微調”,大模型可能會“學得多錯得多”,因為不同任務之間的沖突,導致泛化能力下降。
        △多模態指令微調存在任務沖突舉個例子,多模態問答任務可能要求回復盡可能簡潔準確,文檔理解任務卻會反過來要求大模型盡可能詳細地做出描述。
        不同下游任務指令微調數據分布差異較大,導致一個大模型難以在多個下游任務中均達到最優性能。
        如何解決這個問題?
        來自香港科技大學、南方科技大學和華為諾亞方舟實驗室的聯合研究團隊,受MoE(混合專家模型)開源大模型Mixtral-8×7B的啟發,提出利用稀疏專家模型,打造下游任務泛化性能更好、理解能力更強的多模態大模型。
        具體細節,一起來看。
        多模態指令微調存在任務沖突為了驗證多模態指令微調中不同類型任務數據對模型性能的影響,研究人員將數據進行如下劃分:
        VQA(視覺問答):VQAv2、OKVQA、A-OKVQA、OCRVQA,
        Captioning(圖像描述):COCO Caption、Web CapFilt


        原文鏈接:多模態大模型學雜了能力反下降?新研究:MoE+通用專家解決沖突

        聯系作者

        文章來源:量子位
        作者微信:QbitAI
        作者簡介:追蹤人工智能新趨勢,關注科技行業新突破

        閱讀原文
        ? 版權聲明
        Trae官網

        相關文章

        Trae官網

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 亚洲乱码无人区卡1卡2卡3| 亚洲jjzzjjzz在线观看| 深夜福利在线视频免费| 成人片黄网站色大片免费| 91成人免费福利网站在线| 国产亚洲精品免费视频播放| 免费无码又爽又黄又刺激网站| 亚洲黄片毛片在线观看| 一级特黄录像免费播放中文版| 亚洲午夜爱爱香蕉片| 手机看片国产免费永久| 亚洲综合精品香蕉久久网97| 永久黄色免费网站| 亚洲已满18点击进入在线观看| 四虎影院免费在线播放| 日韩精品视频在线观看免费| 中文字幕精品亚洲无线码二区 | 国产av无码专区亚洲av果冻传媒| 国产美女视频免费观看的网站| 亚洲精品tv久久久久久久久 | 国产1024精品视频专区免费| 亚洲中文字幕精品久久| 四虎影院永久免费观看| 久久国产精品免费一区二区三区| 久久青青成人亚洲精品| 日本亚洲免费无线码| 美女的胸又黄又www网站免费| 亚洲中文字幕无码一区二区三区| 最近免费mv在线电影| 亚洲日本一线产区和二线| 亚洲欧洲中文日韩av乱码| 毛片无码免费无码播放| 久久精品熟女亚洲av麻豆 | 久久精品国产精品亚洲| 99久久精品免费精品国产| 亚洲av无码成人精品国产| 亚洲人成图片小说网站| 欧美日韩国产免费一区二区三区| 粉色视频免费入口| 亚洲黄色三级视频| 亚洲人成无码网站久久99热国产|