月之暗面發(fā)布首款數(shù)學(xué)模型 k0-math,對標(biāo)o1
AIGC動態(tài)歡迎閱讀
原標(biāo)題:月之暗面發(fā)布首款數(shù)學(xué)模型 k0-math,對標(biāo)o1
關(guān)鍵字:模型,數(shù)學(xué),數(shù)據(jù),場景,核心
文章來源:AI科技評論
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
楊植麟:Kimi目前最核心的任務(wù)是提升留存。作者丨張 進
編輯丨陳彩嫻
今天,在京東科技大廈,月之暗面創(chuàng)始人楊植麟宣布 Kimi 數(shù)學(xué)模型 k0-math 正式發(fā)布,其數(shù)學(xué)能力對標(biāo)OpenAI o1系列,還公布了截止2024年10月 Kimi 月活超過 3600萬。
楊植麟稱未來會更關(guān)注基于強化學(xué)習(xí)的方法去scale,不僅僅是簡單地預(yù)測下一個token是什么,因為這是基于靜態(tài)數(shù)據(jù)集,使得大模型不能完成更難的任務(wù)。在這個過程中,很重要的是讓AI具備思考的能力。
用Next—Token prediction是做不到的,而用強化學(xué)習(xí)的方法一定程度上可以學(xué)習(xí)到這種思考的方式。例如解一道數(shù)學(xué)題,想要知道它的解題思路是怎樣的,最后的結(jié)果是怎么一步步推導(dǎo)出來的,這就是一個深度思考的過程。
伽利略曾說,數(shù)學(xué)是宇宙的語言,所以數(shù)學(xué)場景是一個很廣泛的應(yīng)用場景,是培養(yǎng) AI 具備思考能力的最佳場景。OpenAI的 o1 模型最初也是從數(shù)學(xué)場景出發(fā),好處是不用跟外界進行交互,可以自成一體。
k0—math正是從數(shù)學(xué)場景出發(fā),再推理泛化到更多的任務(wù)上。
例如,問它一個很難的競賽題,k0—math 通過大量的嘗
原文鏈接:月之暗面發(fā)布首款數(shù)學(xué)模型 k0-math,對標(biāo)o1
聯(lián)系作者
文章來源:AI科技評論
作者微信:
作者簡介: