国产精品亚洲mnbav网站_成人午夜亚洲精品无码网站_日韩va亚洲va欧洲va国产_亚洲欧洲精品成人久久曰影片

MM-Eureka

AI工具7個月前更新 AI工具集
610 0 0

MM-Eureka – 上海AI Lab聯(lián)合上交大等推出的多模態(tài)推理模型

MM-Eureka 是一個由上海人工智能實驗室、上海創(chuàng)智學(xué)院、上海交通大學(xué)和香港大學(xué)的研究者們共同研發(fā)的多模態(tài)推理模型。該模型利用基于規(guī)則的大規(guī)模強(qiáng)化學(xué)習(xí)(RL),將單模態(tài)推理中的關(guān)鍵特性,如回答長度的穩(wěn)定增長、準(zhǔn)確率獎勵和視覺頓悟時刻,成功擴(kuò)展至多模態(tài)場景。

MM-Eureka是什么

MM-Eureka 是一個專門設(shè)計的多模態(tài)推理模型,開發(fā)團(tuán)隊由上海人工智能實驗室、上海創(chuàng)智學(xué)院、上海交通大學(xué)和香港大學(xué)的研究人員組成。該模型通過規(guī)則驅(qū)動的大規(guī)模強(qiáng)化學(xué)習(xí)(RL),將單模態(tài)推理中的重要特性(例如穩(wěn)定的回答長度增長、準(zhǔn)確率獎勵以及視覺頓悟時刻)遷移至多模態(tài)環(huán)境中。

MM-Eureka 提供了兩個核心模型:MM-Eureka-8B 和 MM-Eureka-Zero-38B,分別基于 InternVL2.5-Instruct-8B 和 InternVL2.5-Pretrained-38B。僅使用 54,000 張圖文數(shù)據(jù)進(jìn)行規(guī)則型強(qiáng)化學(xué)習(xí)訓(xùn)練,平均性能便超越了使用 1,000,000 張數(shù)據(jù)的 MPO 模型。MM-Eureka-Zero-38B 僅利用 8,000 張圖文數(shù)學(xué)推理數(shù)據(jù),在自主構(gòu)建的 K12 基準(zhǔn)測試中超過了指令模型 8.2%,在 MathVerse 上的表現(xiàn)也相當(dāng)出色。

MM-Eureka

MM-Eureka的主要功能

  • 多模態(tài)推理能力:MM-Eureka 能夠有效處理文本和視覺信息,擴(kuò)展了大規(guī)模基于規(guī)則的強(qiáng)化學(xué)習(xí)(RL)至多模態(tài)推理領(lǐng)域。
  • 復(fù)現(xiàn)關(guān)鍵特性:該模型成功在多模態(tài)空間中復(fù)現(xiàn)了文本 RL 系統(tǒng)(如 DeepSeek-R1)的核心特性,包括準(zhǔn)確率獎勵和響應(yīng)長度的穩(wěn)定增長,以及反思行為的自發(fā)涌現(xiàn)。
  • 數(shù)據(jù)高效性:在僅使用 54,000 張圖文數(shù)據(jù)進(jìn)行規(guī)則型 RL 訓(xùn)練的情況下,MM-Eureka 的平均性能超過了使用 1,000,000 張數(shù)據(jù)的 MPO 模型,整體基準(zhǔn)準(zhǔn)確率與使用 12,000,000 張數(shù)據(jù)進(jìn)行 CoT SFT 訓(xùn)練的模型相當(dāng)。

MM-Eureka的技術(shù)原理

  • 基于規(guī)則的大規(guī)模強(qiáng)化學(xué)習(xí)框架:MM-Eureka 基于 OpenRLHF 開發(fā)了一個高效且可擴(kuò)展的多模態(tài)大規(guī)模強(qiáng)化學(xué)習(xí)框架,支持多種模型及 RL 算法,使得模型能夠在多模態(tài)環(huán)境中進(jìn)行有效訓(xùn)練,并成功復(fù)現(xiàn)了 DeepSeek-R1 的關(guān)鍵特性。
  • 數(shù)據(jù)過濾與穩(wěn)定訓(xùn)練:團(tuán)隊發(fā)現(xiàn),數(shù)據(jù)選擇對于穩(wěn)定的 RL 訓(xùn)練至關(guān)重要,基于難度的數(shù)據(jù)過濾策略對訓(xùn)練的穩(wěn)定性起到了關(guān)鍵作用。
  • 視覺頓悟時刻(Visual aha-moment):MM-Eureka 在訓(xùn)練過程中展現(xiàn)了類似 DeepSeek-R1 的視覺頓悟時刻,表現(xiàn)為模型學(xué)會反思與回溯,重新審視圖像中的關(guān)鍵信息。
  • 極簡的強(qiáng)化學(xué)習(xí)設(shè)計:在 MM-Eureka 中,極簡的 RL 設(shè)計被證明是有效的。實驗表明,添加 KL 散度會限制模型探索,導(dǎo)致無法觀察到響應(yīng)長度的提升,因此采用簡單的獎勵函數(shù)(如準(zhǔn)確性獎勵和格式獎勵),結(jié)合難度基礎(chǔ)的數(shù)據(jù)過濾策略進(jìn)行穩(wěn)定訓(xùn)練。
  • 高效的數(shù)據(jù)利用:MM-Eureka 顯示出極高的數(shù)據(jù)效率。僅用 54,000 張圖文數(shù)據(jù)進(jìn)行規(guī)則型強(qiáng)化學(xué)習(xí)訓(xùn)練,其平均性能即超越了使用 1,000,000 張數(shù)據(jù)的 MPO 模型。MM-Eureka-Zero 僅利用 8,000 張圖文數(shù)學(xué)推理數(shù)據(jù)(指令模型的 0.05%),在自建的 K12 基準(zhǔn)測試中超越指令模型 8.2%,在 MathVerse 上表現(xiàn)相當(dāng),表明在多模態(tài)推理領(lǐng)域,簡單的規(guī)則型 RL 設(shè)計可以顯著提升訓(xùn)練效果,即使在數(shù)據(jù)量較少的情況下,也能達(dá)到與大規(guī)模訓(xùn)練相當(dāng)?shù)男阅堋?/li>

MM-Eureka的項目地址

MM-Eureka的應(yīng)用場景

  • 教育領(lǐng)域:通過強(qiáng)大的推理能力和反思機(jī)制,MM-Eureka 有助于學(xué)生更好地理解和解決復(fù)雜數(shù)學(xué)問題。
  • 增強(qiáng)現(xiàn)實(AR)和虛擬現(xiàn)實(VR):在 AR 和 VR 場景中,結(jié)合視覺與語言信息,MM-Eureka 可以提供更沉浸式和交互式的用戶體驗。
  • 數(shù)據(jù)分析和決策支持:MM-Eureka 的多模態(tài)推理能力使其在數(shù)據(jù)分析和決策支持方面表現(xiàn)優(yōu)異,能夠處理復(fù)雜的圖文數(shù)據(jù),幫助用戶從大量信息中提取關(guān)鍵信息,做出更明智的決策。
  • 自動化和智能助手:作為智能助手的核心技術(shù),MM-Eureka 能為用戶提供更智能和自然的交互體驗。
  • 游戲和娛樂:在游戲和娛樂領(lǐng)域,MM-Eureka 的多模態(tài)推理能力可以用于研發(fā)更智能的非玩家角色(NPC)和交互式劇情。

常見問題

  • MM-Eureka支持哪些類型的輸入數(shù)據(jù)?MM-Eureka 支持文本和視覺信息的多模態(tài)輸入,能夠處理復(fù)雜的圖文數(shù)據(jù)。
  • 如何獲取MM-Eureka的源代碼?您可以訪問其Github倉庫 [MM-Eureka GitHub](https://github.com/ModalMinds/MM-EUREKA) 下載源代碼。
  • MM-Eureka的性能如何?MM-Eureka 展現(xiàn)出優(yōu)秀的性能,僅使用少量數(shù)據(jù)就能超越使用大量數(shù)據(jù)訓(xùn)練的模型。
閱讀原文
? 版權(quán)聲明
蟬鏡AI數(shù)字人

相關(guān)文章

蟬鏡AI數(shù)字人

暫無評論

暫無評論...
国产精品亚洲mnbav网站_成人午夜亚洲精品无码网站_日韩va亚洲va欧洲va国产_亚洲欧洲精品成人久久曰影片
<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        成人av免费在线观看| 久久久久久久国产精品影院| 欧美日韩在线一区二区| 中文字幕在线播放不卡一区| 99久久99久久久精品齐齐| 激情文学综合丁香| 精品久久久久久亚洲综合网| 激情六月婷婷久久| 大尺度一区二区| 91在线视频在线| 欧美区在线观看| 久久精品夜色噜噜亚洲aⅴ| 伊人开心综合网| 久久成人羞羞网站| 91蜜桃视频在线| 欧美精品在线一区二区三区| 久久视频一区二区| 亚洲成人你懂的| 懂色av中文字幕一区二区三区| 国产精品一区二区久激情瑜伽| 成人动漫一区二区在线| 91精品国产综合久久久蜜臀图片| 欧美高清激情brazzers| 久久九九久久九九| 日本欧美韩国一区三区| 91在线视频播放地址| 精品福利在线导航| 一区二区三区在线播| 国产91精品入口| 7777女厕盗摄久久久| 国产精品久久久久久久浪潮网站 | 日韩亚洲欧美成人一区| 色综合久久88色综合天天免费| 99视频热这里只有精品免费| 久久97超碰色| 中文字幕精品综合| 亚洲欧美一区二区视频| 最新高清无码专区| 欧美成人在线直播| 欧美极品少妇xxxxⅹ高跟鞋| 亚洲精品成a人| 日韩精品资源二区在线| 精品一区二区三区蜜桃| 国产999精品久久久久久| 99久久er热在这里只有精品15| 亚洲美女视频一区| 日韩欧美国产高清| 在线观看亚洲成人| 欧美精品xxxxbbbb| 日本精品一级二级| 国产精品456| 国产传媒一区在线| 日本成人在线看| av中文字幕在线不卡| 欧美性高清videossexo| 久久成人久久爱| 色吧成人激情小说| 久久丁香综合五月国产三级网站| 一区二区三区丝袜| 国产激情视频一区二区在线观看| 99riav久久精品riav| 国产麻豆精品在线观看| 一本大道久久精品懂色aⅴ| 久久女同性恋中文字幕| 亚洲精品伦理在线| 亚洲欧美在线另类| 一区二区三区四区在线免费观看 | 国产成人av电影在线播放| 亚洲日本在线a| 久久久天堂av| 国产精品欧美极品| 精品污污网站免费看| 国产精品私人影院| 国产精品中文欧美| 911国产精品| 欧美不卡视频一区| 日本v片在线高清不卡在线观看| jlzzjlzz亚洲日本少妇| 日本道在线观看一区二区| 国产日韩精品一区二区三区| 亚洲成人av在线电影| 波多野结衣亚洲| 国产欧美日韩三区| 国产乱码一区二区三区| 精品国产第一区二区三区观看体验| 一区二区三区小说| 久久91精品国产91久久小草| 欧美日韩精品一区二区三区四区| 国产欧美精品一区二区三区四区| 亚洲一二三区在线观看| 日本美女视频一区二区| 美女爽到高潮91| 轻轻草成人在线| 国产精品888| 日韩欧美成人一区二区| 亚洲欧美视频在线观看视频| 国产乱子伦视频一区二区三区 | 日韩精品乱码av一区二区| 国产精品资源网站| 91九色02白丝porn| 亚洲一二三四区不卡| 成人av在线资源网站| 欧美顶级少妇做爰| 国产在线精品不卡| 亚洲天堂免费在线观看视频| 欧美性猛片xxxx免费看久爱| 亚洲国产一区二区三区 | 欧美一级生活片| 久久久久久久免费视频了| 国产91精品精华液一区二区三区| 91影院在线免费观看| 精品国产乱码久久久久久久久| 国产精品18久久久| 中文字幕日韩一区二区| 欧美私模裸体表演在线观看| 男男视频亚洲欧美| 欧美色精品天天在线观看视频| 亚洲成人免费电影| jizzjizzjizz欧美| 亚洲成人激情av| 久久夜色精品国产噜噜av| 日本成人在线一区| 国产欧美精品在线观看| 欧美日韩一二区| 国产综合色精品一区二区三区| 一本一道久久a久久精品| 视频在线在亚洲| 日韩欧美一区二区免费| 91在线观看地址| 麻豆精品新av中文字幕| 日韩欧美一级二级| 欧美性受xxxx黑人xyx| 成人在线视频一区| 蜜桃精品视频在线| 国产精品色哟哟网站| 色综合久久九月婷婷色综合| 精一区二区三区| 中文字幕视频一区| 精品动漫一区二区三区在线观看| www.久久久久久久久| 奇米色一区二区三区四区| 成人在线综合网站| 麻豆成人av在线| 亚洲激情中文1区| 国产精品色婷婷久久58| 日韩西西人体444www| 日日摸夜夜添夜夜添精品视频| 国产精品麻豆一区二区| 成人综合婷婷国产精品久久 | 国产欧美日韩中文久久| 亚洲主播在线播放| 色素色在线综合| 国产美女娇喘av呻吟久久| 欧美一级高清片| 婷婷中文字幕一区三区| 精品成a人在线观看| 欧美吞精做爰啪啪高潮| www.亚洲免费av| 丰满少妇久久久久久久| 国内精品自线一区二区三区视频| 免费人成精品欧美精品 | 亚洲bt欧美bt精品777| 久久蜜桃一区二区| 99麻豆久久久国产精品免费| 处破女av一区二区| 国产xxx精品视频大全| 欧美激情一区二区三区全黄| 国产传媒欧美日韩成人| 国产999精品久久| 成人深夜视频在线观看| 国产另类ts人妖一区二区| 国产a久久麻豆| 成人激情午夜影院| 91国偷自产一区二区三区成为亚洲经典| 成人免费精品视频| 色综合天天狠狠| 欧美日韩午夜精品| 久久亚洲综合色一区二区三区| 91精品国产色综合久久不卡蜜臀| 91看片淫黄大片一级| 91麻豆精品秘密| 99久久精品费精品国产一区二区| 成人免费毛片app| 日本久久一区二区三区| 国内不卡的二区三区中文字幕| 久久久久久久久久久久久女国产乱 | 91视频国产观看| 久久99精品国产麻豆不卡| 欧美精品一区二区三区在线| 日韩欧美国产综合一区| 精品免费日韩av| 国产免费观看久久| 欧美日韩午夜在线| 亚洲精品一区二区三区香蕉| 欧美国产成人精品| 亚洲成人av电影在线| 国产精品一二一区| 在线观看91视频| 亚洲精品在线电影| 亚洲一区二区三区在线看|