Unlock Your Math and Coding Potential: Ace High School Competitions and Leetcode Challenges with InternThinker!
大模型推理能力再上新臺(tái)階
原標(biāo)題:上海AI Lab上線強(qiáng)推理模型InternThinker,高中生數(shù)學(xué)競(jìng)賽和Leetcode賽題全通關(guān)!
文章來源:智猩猩GenAI
內(nèi)容字?jǐn)?shù):4890字
2024中國(guó)生成式AI大會(huì)(上海站)預(yù)告
2024年12月5日至6日,智猩猩將聯(lián)合主辦2024中國(guó)生成式AI大會(huì)(上海站)。此次大會(huì)將設(shè)有主會(huì)場(chǎng)和分會(huì)場(chǎng),主會(huì)場(chǎng)將舉行大模型峰會(huì)和AI Infra峰會(huì),分會(huì)場(chǎng)則將進(jìn)行端側(cè)生成式AI、AI視頻生成和具身智能三場(chǎng)技術(shù)研討會(huì)。歡迎廣大用戶報(bào)名參加!
上海人工智能實(shí)驗(yàn)室的創(chuàng)新進(jìn)展
上海人工智能實(shí)驗(yàn)室致力于探索開放、可控、可信的通用人工智能(AGI),其關(guān)鍵技術(shù)之一是同步提升深度推理與專業(yè)泛化能力。2024年11月25日,實(shí)驗(yàn)室展示了包括自主生成高智力密度數(shù)據(jù)和具備元?jiǎng)幼魉伎寄芰Φ摹澳P汀钡纫幌盗袆?chuàng)新進(jìn)展,并開放了強(qiáng)推理模型書生InternThinker的試用體驗(yàn)。該模型在多種復(fù)雜推理任務(wù)上表現(xiàn)出色,具備自我反思和糾正的能力。
元?jiǎng)幼魉伎寂c推理能力提升
InternThinker采用元?jiǎng)幼魉伎挤妒剑梃b人類學(xué)習(xí)方式,通過動(dòng)態(tài)選擇元?jiǎng)幼鱽硖嵘评砟芰ΑT撃P湍軌蛟趶?fù)雜任務(wù)中靈活使用“回憶知識(shí)-解答”和“執(zhí)行-反思”等策略組合,顯著提高學(xué)習(xí)效率。與傳統(tǒng)鏈?zhǔn)酵评硐啾龋?jīng)過元?jiǎng)幼饕龑?dǎo)后,模型在解決問題時(shí)表現(xiàn)出更高的靈活性和效率。
高密度監(jiān)督數(shù)據(jù)路徑的探索
上海AI實(shí)驗(yàn)室采用“通專融合”的技術(shù)路線,通過專家模型與通用模型的協(xié)作,合成高密度數(shù)據(jù)以提升推理能力。此外,研究團(tuán)隊(duì)構(gòu)建了大規(guī)模沙盒環(huán)境,為復(fù)雜推理任務(wù)提供反饋信號(hào),進(jìn)一步增強(qiáng)了模型的思維能力。
實(shí)例展示與未來展望
InternThinker在解決高中數(shù)學(xué)競(jìng)賽題目時(shí)表現(xiàn)出色,能夠回憶相關(guān)知識(shí)并逐步推理。此外,在應(yīng)對(duì)更復(fù)雜的推理任務(wù)時(shí),模型展現(xiàn)了反思和修正的能力。未來,上海AI實(shí)驗(yàn)室將繼續(xù)提升模型的推理能力,并將相關(guān)技術(shù)融入下一代書生大模型,推動(dòng)技術(shù)進(jìn)步。
歡迎廣大用戶及開發(fā)者試用InternThinker,體驗(yàn)鏈接為:https://internlm-chat.intern-ai.org.cn。通過不斷的反饋與迭代,期待模型的持續(xù)優(yōu)化與創(chuàng)新。
聯(lián)系作者
文章來源:智猩猩GenAI
作者微信:
作者簡(jiǎn)介:智猩猩旗下矩陣賬號(hào)之一,聚焦大模型開啟的通用人工智能浪潮。