Q*項(xiàng)目公開(kāi)發(fā)布!研究團(tuán)隊(duì)并非OpenAI
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:Q*項(xiàng)目公開(kāi)發(fā)布!研究團(tuán)隊(duì)并非OpenAI
關(guān)鍵字:模型,準(zhǔn)確率,數(shù)據(jù),狀態(tài),團(tuán)隊(duì)
文章來(lái)源:量子位
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
昆侖萬(wàn)維 投稿量子位 | 公眾號(hào) QbitAIQ*項(xiàng)目公開(kāi)發(fā)布,可讓小模型達(dá)到參數(shù)量比其大數(shù)十倍、甚至上百倍模型的推理能力。
自去年11月伴隨著OpenAI內(nèi)訌,其神秘Q*項(xiàng)目被爆出后,業(yè)內(nèi)對(duì)OpenAI Q*的討論和猜測(cè)就沒(méi)停過(guò),而OpenAI這邊一直避而不談。
在當(dāng)時(shí),一些人就從名字猜測(cè)Q*可能與Q-Learning有關(guān),例如Meta科學(xué)家田淵棟提出Q*可能是Q-learning和A*的結(jié)合:
而現(xiàn)在,一項(xiàng)名為Q*的項(xiàng)目突然公開(kāi)發(fā)布,而且真的和Q-Learning、A*有關(guān)。
不過(guò),研究團(tuán)隊(duì)并非OpenAI,更不是DeepMind(相傳,OpenAI的Q*項(xiàng)目前身是GPT-Zero,由Ilya Sutskever發(fā)起,名字致敬了DeepMind的Alpha-Zero)。
而是來(lái)自國(guó)內(nèi)昆侖萬(wàn)維顏水成團(tuán)隊(duì)與新加坡南洋理工大學(xué)的一項(xiàng)新工作。
團(tuán)隊(duì)表示,希望Q*算法能夠打破OpenAI的,提升現(xiàn)有開(kāi)源模型的推理能力。實(shí)驗(yàn)中,Q*算法的表現(xiàn)也很給力:
在GSM8K數(shù)據(jù)集上,Q*幫助Llama-2-7b提升至80.8%的準(zhǔn)確率,超越了ChatGPT;
在MATH數(shù)據(jù)集上,Q*幫助DeepS
原文鏈接:Q*項(xiàng)目公開(kāi)發(fā)布!研究團(tuán)隊(duì)并非OpenAI
聯(lián)系作者
文章來(lái)源:量子位
作者微信:QbitAI
作者簡(jiǎn)介:追蹤人工智能新趨勢(shì),關(guān)注科技行業(yè)新突破