Llama3-8B秒殺700億巨獸?北大博士生等全新「BoT」框架推理暴漲70倍,24點圖形推理一步成神
AIGC動態(tài)歡迎閱讀
原標(biāo)題:Llama3-8B秒殺700億巨獸?北大博士生等全新「BoT」框架推理暴漲70倍,24點圖形推理一步成神
關(guān)鍵字:企鵝,任務(wù),模板,思維,問題
文章來源:新智元
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
新智元報道編輯:Aeneas 好困
【新智元導(dǎo)讀】24點游戲、幾何圖形、一步將死問題,這些推理密集型任務(wù),難倒了一片大模型,怎么破?北大、UC伯克利、斯坦福研究者最近提出了一種全新的BoT方法,用思維模板大幅增強(qiáng)了推理性能。而Llama3-8B在BoT的加持下,竟多次超越Llama3-70B!大語言模型不擅長推理怎么辦?
用思維緩沖區(qū)(Buffer of Thoughts,BoT)來解決!
最近,北大、UC伯克利、斯坦福的研究人員提出了一種元緩沖區(qū)(meta-buffer)。它可以存儲一系列信息豐富的高級思維,也就是所謂的「思維模板」,它是從各種任務(wù)的問題解決過程中蒸餾出來的。
論文地址:https://arxiv.org/abs/2406.04271
然后,對于每個問題,都可以檢索相關(guān)的思維模板,然后用特定的推理結(jié)構(gòu)讓它自適應(yīng),這樣就可以進(jìn)行有效的推理了!
在以往,24點游戲(Game of 24)、幾何圖形任務(wù)(Geometric Shapes)、一步將死問題(Checkmate-in-One)這些推理密集型任務(wù),難倒了不少LLM。
24點游戲
而使用思維緩沖區(qū)(BoT)后,與之
原文鏈接:Llama3-8B秒殺700億巨獸?北大博士生等全新「BoT」框架推理暴漲70倍,24點圖形推理一步成神
聯(lián)系作者
文章來源:新智元
作者微信:AI_era
作者簡介:智能+中國主平臺,致力于推動中國從互聯(lián)網(wǎng)+邁向智能+新紀(jì)元。重點關(guān)注人工智能、機(jī)器人等前沿領(lǐng)域發(fā)展,關(guān)注人機(jī)融合、人工智能和機(jī)器人對人類社會與文明進(jìn)化的影響,領(lǐng)航中國新智能時代。