Unlock Your Math and Coding Potential: Ace High School Competitions and Leetcode Challenges with InternThinker!
大模型推理能力再上新臺階

原標(biāo)題:上海AI Lab上線強推理模型InternThinker,高中生數(shù)學(xué)競賽和Leetcode賽題全通關(guān)!
文章來源:智猩猩GenAI
內(nèi)容字數(shù):4890字
2024中國生成式AI大會(上海站)預(yù)告
2024年12月5日至6日,智猩猩將聯(lián)合主辦2024中國生成式AI大會(上海站)。此次大會將設(shè)有主會場和分會場,主會場將舉行大模型峰會和AI Infra峰會,分會場則將進行端側(cè)生成式AI、AI視頻生成和具身智能三場技術(shù)研討會。歡迎廣大用戶報名參加!
上海人工智能實驗室的創(chuàng)新進展
上海人工智能實驗室致力于探索開放、可控、可信的通用人工智能(AGI),其關(guān)鍵技術(shù)之一是同步提升深度推理與專業(yè)泛化能力。2024年11月25日,實驗室展示了包括自主生成高智力密度數(shù)據(jù)和具備元動作思考能力的“模型”等一系列創(chuàng)新進展,并開放了強推理模型書生InternThinker的試用體驗。該模型在多種復(fù)雜推理任務(wù)上表現(xiàn)出色,具備自我反思和糾正的能力。
元動作思考與推理能力提升
InternThinker采用元動作思考范式,借鑒人類學(xué)習(xí)方式,通過動態(tài)選擇元動作來提升推理能力。該模型能夠在復(fù)雜任務(wù)中靈活使用“回憶知識-解答”和“執(zhí)行-反思”等策略組合,顯著提高學(xué)習(xí)效率。與傳統(tǒng)鏈式推理相比,經(jīng)過元動作引導(dǎo)后,模型在解決問題時表現(xiàn)出更高的靈活性和效率。
高密度監(jiān)督數(shù)據(jù)路徑的探索
上海AI實驗室采用“通專融合”的技術(shù)路線,通過專家模型與通用模型的協(xié)作,合成高密度數(shù)據(jù)以提升推理能力。此外,研究團隊構(gòu)建了大規(guī)模沙盒環(huán)境,為復(fù)雜推理任務(wù)提供反饋信號,進一步增強了模型的思維能力。
實例展示與未來展望
InternThinker在解決高中數(shù)學(xué)競賽題目時表現(xiàn)出色,能夠回憶相關(guān)知識并逐步推理。此外,在應(yīng)對更復(fù)雜的推理任務(wù)時,模型展現(xiàn)了反思和修正的能力。未來,上海AI實驗室將繼續(xù)提升模型的推理能力,并將相關(guān)技術(shù)融入下一代書生大模型,推動技術(shù)進步。
歡迎廣大用戶及開發(fā)者試用InternThinker,體驗鏈接為:https://internlm-chat.intern-ai.org.cn。通過不斷的反饋與迭代,期待模型的持續(xù)優(yōu)化與創(chuàng)新。
聯(lián)系作者
文章來源:智猩猩GenAI
作者微信:
作者簡介:智猩猩旗下矩陣賬號之一,聚焦大模型開啟的通用人工智能浪潮。

粵公網(wǎng)安備 44011502001135號