等不來OpenAI的Q*,華為諾亞探索LLM推理的秘密武器MindStar先來了
AIGC動態(tài)歡迎閱讀
原標(biāo)題:等不來OpenAI的Q*,華為諾亞探索LLM推理的秘密武器MindStar先來了
關(guān)鍵字:模型,路徑,華為,報告,步驟
文章來源:機(jī)器之心
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
AIxiv專欄是機(jī)器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過去數(shù)年,機(jī)器之心AIxiv專欄接收報道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級實(shí)驗(yàn)室,有效促進(jìn)了學(xué)術(shù)交流與傳播。如果您有優(yōu)秀的工作想要分享,歡迎投稿或者聯(lián)系報道。投稿郵箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com本論文作者來自華為蒙特利爾諾亞方舟實(shí)驗(yàn)室的康計(jì)堃,李信擇,陳熙, Amirreza Kazemi,陳博興。
人工智能(AI)在過去十年里取得了長足進(jìn)步,特別是在自然語言處理和計(jì)算機(jī)視覺領(lǐng)域。然而,如何提升 AI 的認(rèn)知能力和推理能力,仍然是一個巨大的挑戰(zhàn)。
近期,一篇題為《MindStar: Enhancing Math Reasoning in Pre-trained LLMs at Inference Time》的論文提出了基于樹搜索的推理時間能力提升方法 MindStar [1],該方法在開源模型 Llama-13-B 與 Mistral-7B 上達(dá)到了近似閉源大模型 GPT-3.5 與 Grok-1 在數(shù)學(xué)問題上的推理能力。論文標(biāo)題:MindStar:
原文鏈接:等不來OpenAI的Q*,華為諾亞探索LLM推理的秘密武器MindStar先來了
聯(lián)系作者
文章來源:機(jī)器之心
作者微信:almosthuman2014
作者簡介:專業(yè)的人工智能媒體和產(chǎn)業(yè)服務(wù)平臺