百倍提升7B模型推理能力!顏水成團(tuán)隊(duì)攜手新加坡南洋理工大學(xué)發(fā)布Q*算法
AIGC動態(tài)歡迎閱讀
原標(biāo)題:百倍提升7B模型推理能力!顏水成團(tuán)隊(duì)攜手新加坡南洋理工大學(xué)發(fā)布Q*算法
關(guān)鍵字:模型,團(tuán)隊(duì),論文,人工智能,算法
文章來源:新智元
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
新智元報(bào)道編輯:好困
【新智元導(dǎo)讀】近日,一篇出自中國團(tuán)隊(duì)之手的AI論文在引發(fā)熱議。論文中,研究團(tuán)隊(duì)提出了Q*模型算法,幫助Llama-2-7b等小模型達(dá)到參數(shù)量比其大數(shù)十倍、甚至上百倍模型的推理能力,使模型性能迎來驚人提升。自OpenAI的Q*項(xiàng)目曝光后,業(yè)內(nèi)相關(guān)討論始終層出不窮。
據(jù)現(xiàn)有信息匯總,Q*項(xiàng)目被視作OpenAI在探索人工通用智能(Artificial General Intelligence, AGI)道路上的一次重大嘗試,有望在包括數(shù)學(xué)問題解決能力、自主學(xué)習(xí)和自我改進(jìn)等多個層面對人工智能技術(shù)帶來革新性突破。(英偉達(dá)科學(xué)家Jim Fan、圖靈獎得主Yann LeCun等參與討論OpenAI的Q*實(shí)現(xiàn)方式)
(Meta科學(xué)家田淵棟則認(rèn)為Q*是Q-learning和A*的結(jié)合,且天然地適合推理任務(wù),尤其在數(shù)學(xué)推理方面)
不過迄今為止OpenAI沒有公開關(guān)于Q*算法的具體細(xì)節(jié),其效果究竟如何我們并不得而知。
然而就在近日,一篇名為《Q*: Improving Multi-step Reasoning for LLMs with Deliberative Planning
原文鏈接:百倍提升7B模型推理能力!顏水成團(tuán)隊(duì)攜手新加坡南洋理工大學(xué)發(fā)布Q*算法
聯(lián)系作者
文章來源:新智元
作者微信:AI_era
作者簡介:智能+中國主平臺,致力于推動中國從互聯(lián)網(wǎng)+邁向智能+新紀(jì)元。重點(diǎn)關(guān)注人工智能、機(jī)器人等前沿領(lǐng)域發(fā)展,關(guān)注人機(jī)融合、人工智能和機(jī)器人對人類社會與文明進(jìn)化的影響,領(lǐng)航中國新智能時(shí)代。