AIGC動態歡迎閱讀
原標題:Llama3-8B秒殺700億巨獸?北大博士生等全新「BoT」框架推理暴漲70倍,24點圖形推理一步成神
關鍵字:企鵝,任務,模板,思維,問題
文章來源:新智元
內容字數:0字
內容摘要:
新智元報道編輯:Aeneas 好困
【新智元導讀】24點游戲、幾何圖形、一步將死問題,這些推理密集型任務,難倒了一片大模型,怎么破?北大、UC伯克利、斯坦福研究者最近提出了一種全新的BoT方法,用思維模板大幅增強了推理性能。而Llama3-8B在BoT的加持下,竟多次超越Llama3-70B!大語言模型不擅長推理怎么辦?
用思維緩沖區(Buffer of Thoughts,BoT)來解決!
最近,北大、UC伯克利、斯坦福的研究人員提出了一種元緩沖區(meta-buffer)。它可以存儲一系列信息豐富的高級思維,也就是所謂的「思維模板」,它是從各種任務的問題解決過程中蒸餾出來的。
論文地址:https://arxiv.org/abs/2406.04271
然后,對于每個問題,都可以檢索相關的思維模板,然后用特定的推理結構讓它自適應,這樣就可以進行有效的推理了!
在以往,24點游戲(Game of 24)、幾何圖形任務(Geometric Shapes)、一步將死問題(Checkmate-in-One)這些推理密集型任務,難倒了不少LLM。
24點游戲
而使用思維緩沖區(BoT)后,與之
原文鏈接:Llama3-8B秒殺700億巨獸?北大博士生等全新「BoT」框架推理暴漲70倍,24點圖形推理一步成神
聯系作者
文章來源:新智元
作者微信:AI_era
作者簡介:智能+中國主平臺,致力于推動中國從互聯網+邁向智能+新紀元。重點關注人工智能、機器人等前沿領域發展,關注人機融合、人工智能和機器人對人類社會與文明進化的影響,領航中國新智能時代。