<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        剛剛,階躍星辰發布Step R-mini!推理模型從此不再文理偏科

        AIGC動態8個月前發布 機器之心
        278 0 0

        這是階躍星辰 Step 系列模型家族的首個推理模型。

        剛剛,階躍星辰發布Step R-mini!推理模型從此不再文理偏科

        原標題:剛剛,階躍星辰發布Step R-mini!推理模型從此不再文理偏科
        文章來源:機器之心
        內容字數:4404字

        國產推理大模型Step Reasoner mini強勢來襲

        國產大模型“六小虎”成員階躍星辰發布了其首個推理模型Step Reasoner mini(Step R-mini),在多個基準測試中達到SOTA水平,甚至超越了OpenAI的o1-mini模型。該模型具備強大的超長推理能力,能夠解決邏輯推理、代碼、數學等復雜問題,同時也能勝任文學創作等通用任務,實現“文理兼修”。

        1. Step R-mini 的核心能力與優勢

        Step R-mini 通過在推理階段增加計算量,結合思維鏈等技術,實現了“慢思考”,能夠主動規劃、嘗試和反思,最終提供準確可靠的回復。其強大的推理能力源于高比例的強化學習(RL)訓練,以及在數據質量、測試時計算、模型大小等方面的全面Scaling,充分驗證了Scaling Law的有效性。 它在AIME 2024和Math500數學基準測試中均達到SOTA水平,在LiveCodeBench代碼任務上也超過了o1-preview。

        2. “文理兼修”的體現

        Step R-mini 不僅能出色地完成數學、代碼和邏輯推理等任務,還能進行富有創意的文學創作和日常。例如,它能夠準確解答古詩詞相關的算術問題,并解決復雜的數學題,同時還能進行富有創意的翻譯和中文名生成,展現了其強大的“文理兼修”能力。

        3. Step R-mini 的訓練方法

        Step R-mini 的訓練采用了大規模強化學習,并使用了On-Policy強化學習算法。階躍星辰在模型訓練過程中堅持Scaling Law原則,包括Scaling強化學習、Scaling數據質量、Scaling Test-Time Compute和Scaling模型大小,從而提升了模型的推理能力。尤其值得一提的是,在測試階段,System 2范式使Step R-mini能夠進行高達50,000規模的思考token,實現了深度思考。

        4. 視覺推理模型的未來展望

        除了語言推理模型,階躍星辰還在開發視覺推理模型,旨在將推理能力融入更多交互形態的大模型中。該視覺推理模型將通過“慢感知”和空間推理,實現真正的視覺領域推理,而非僅僅基于圖像的文字推理。初步展示的案例表明,該模型能夠解答圖中題目、進行空間推理以及識別圖像中的數字對應關系,展現了其巨大的潛力。

        5. 總結

        Step Reasoner mini的出現標志著國內大模型在推理能力方面取得了顯著進展。其“文理兼修”的能力和強大的推理能力,為未來大模型的發展提供了新的方向。 階躍星辰在Scaling Law上的堅持和對視覺推理模型的探索,也為大模型技術的持續創新提供了有力支撐。


        聯系作者

        文章來源:機器之心
        作者微信:
        作者簡介:專業的人工智能媒體和產業服務平臺

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 日韩亚洲人成网站| 亚洲福利精品一区二区三区| 亚洲日韩中文字幕在线播放| 免费国产草莓视频在线观看黄| 日韩免费高清播放器| 国产婷婷高清在线观看免费| 亚洲免费福利在线视频| 午夜性色一区二区三区免费不卡视频| 久久久久亚洲AV片无码| 精品视频在线免费观看| 西西人体44rt高清亚洲| 99精品视频在线观看免费播放| 亚洲人成电影亚洲人成9999网| 久久成人无码国产免费播放| 亚洲电影免费在线观看| 在线免费观看国产| 亚洲国产综合自在线另类| 性做久久久久久免费观看| 亚洲第一第二第三第四第五第六| 蜜臀91精品国产免费观看| 添bbb免费观看高清视频| 久久精品国产精品亚洲| 国产成人无码区免费网站| 亚洲综合精品香蕉久久网97| 成年黄网站色大免费全看| 亚洲欧洲免费无码| 亚洲国产成人久久精品99| 爱丫爱丫影院在线观看免费| 97se亚洲综合在线| 亚洲av极品无码专区在线观看| 国产又黄又爽胸又大免费视频| 久久精品国产亚洲av麻豆| 免费看男女下面日出水来| 精品亚洲福利一区二区| 亚洲男人的天堂www| 91久久成人免费| 黄色免费网址在线观看| 久久久综合亚洲色一区二区三区| 中国在线观看免费国语版| 黄页免费视频播放在线播放| 亚洲国产综合精品中文第一区|