Llama3-8B秒殺700億巨獸?北大博士生等全新「BoT」框架推理暴漲70倍,24點(diǎn)圖形推理一步成神
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:Llama3-8B秒殺700億巨獸?北大博士生等全新「BoT」框架推理暴漲70倍,24點(diǎn)圖形推理一步成神
關(guān)鍵字:企鵝,任務(wù),模板,思維,問(wèn)題
文章來(lái)源:新智元
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
新智元報(bào)道編輯:Aeneas 好困
【新智元導(dǎo)讀】24點(diǎn)游戲、幾何圖形、一步將死問(wèn)題,這些推理密集型任務(wù),難倒了一片大模型,怎么破?北大、UC伯克利、斯坦福研究者最近提出了一種全新的BoT方法,用思維模板大幅增強(qiáng)了推理性能。而Llama3-8B在BoT的加持下,竟多次超越Llama3-70B!大語(yǔ)言模型不擅長(zhǎng)推理怎么辦?
用思維緩沖區(qū)(Buffer of Thoughts,BoT)來(lái)解決!
最近,北大、UC伯克利、斯坦福的研究人員提出了一種元緩沖區(qū)(meta-buffer)。它可以存儲(chǔ)一系列信息豐富的高級(jí)思維,也就是所謂的「思維模板」,它是從各種任務(wù)的問(wèn)題解決過(guò)程中蒸餾出來(lái)的。
論文地址:https://arxiv.org/abs/2406.04271
然后,對(duì)于每個(gè)問(wèn)題,都可以檢索相關(guān)的思維模板,然后用特定的推理結(jié)構(gòu)讓它自適應(yīng),這樣就可以進(jìn)行有效的推理了!
在以往,24點(diǎn)游戲(Game of 24)、幾何圖形任務(wù)(Geometric Shapes)、一步將死問(wèn)題(Checkmate-in-One)這些推理密集型任務(wù),難倒了不少LLM。
24點(diǎn)游戲
而使用思維緩沖區(qū)(BoT)后,與之
原文鏈接:Llama3-8B秒殺700億巨獸?北大博士生等全新「BoT」框架推理暴漲70倍,24點(diǎn)圖形推理一步成神
聯(lián)系作者
文章來(lái)源:新智元
作者微信:AI_era
作者簡(jiǎn)介:智能+中國(guó)主平臺(tái),致力于推動(dòng)中國(guó)從互聯(lián)網(wǎng)+邁向智能+新紀(jì)元。重點(diǎn)關(guān)注人工智能、機(jī)器人等前沿領(lǐng)域發(fā)展,關(guān)注人機(jī)融合、人工智能和機(jī)器人對(duì)人類社會(huì)與文明進(jìn)化的影響,領(lǐng)航中國(guó)新智能時(shí)代。