連續(xù)思維鏈:顛覆LLM推理的新紀(jì)元!
該研究可以通過梯度下降進(jìn)行端到端的優(yōu)化,因?yàn)檫B續(xù)思維是完全可微的。
原標(biāo)題:田淵棟團(tuán)隊(duì)論文火了!連續(xù)思維鏈優(yōu)于CoT,打開LLM推理新范式
文章來源:機(jī)器之心
內(nèi)容字?jǐn)?shù):9402字
提升LLM推理能力的新方法:Coconut
近年來,隨著大語言模型(LLM)和思維鏈(CoT)的發(fā)展,語言已成為機(jī)器推理的主要媒介。然而,研究者們提出,語言空間并非始終是推理的最佳選擇。為此,Meta和加州大學(xué)圣地亞哥分校的研究團(tuán)隊(duì)提出了一種新方法——Coconut(連續(xù)思維鏈),旨在探索LLM在潛在空間中的推理能力。
1. Coconut方法概述
Coconut通過對(duì)傳統(tǒng)思維鏈的簡(jiǎn)單修改,解放了推理過程。該方法直接將最后的隱藏狀態(tài)作為下一個(gè)token的輸入,而不再依賴語言token。這種方法使得推理過程完全可微,能夠通過梯度下降進(jìn)行端到端優(yōu)化。
2. 實(shí)驗(yàn)設(shè)計(jì)與數(shù)據(jù)集
研究團(tuán)隊(duì)通過三個(gè)數(shù)據(jù)集驗(yàn)證了Coconut方法的有效性,包括數(shù)學(xué)推理任務(wù)(GSM8k)和邏輯推理任務(wù)(ProntoQA與ProsQA)。在實(shí)驗(yàn)中,團(tuán)隊(duì)使用預(yù)訓(xùn)練的GPT-2模型,并進(jìn)行多階段的漸進(jìn)式訓(xùn)練,逐步增加模型的推理難度。
3. 結(jié)果與討論
實(shí)驗(yàn)結(jié)果表明,Coconut顯著提高了LLM的推理能力,尤其在復(fù)雜的邏輯推理任務(wù)中表現(xiàn)優(yōu)于傳統(tǒng)的CoT方法。通過鏈?zhǔn)浇M合的連續(xù)思維,模型能夠在潛在空間中進(jìn)行高效推理,進(jìn)一步增強(qiáng)了其規(guī)劃能力。
4. 連續(xù)思維的優(yōu)勢(shì)
連續(xù)思維不僅能夠編碼多個(gè)潛在的下一個(gè)步驟,還能夠在推理過程中避免早期決策的困難。這種從發(fā)散到收斂的推理機(jī)制使得模型能夠更有效地處理復(fù)雜問題,并且在需要大量規(guī)劃的任務(wù)中表現(xiàn)出色。
5. 未來研究方向
盡管Coconut方法取得了顯著成果,但研究者們指出,模型仍需指導(dǎo)來學(xué)習(xí)潛在空間的推理。未來的研究可以進(jìn)一步探索如何優(yōu)化這種連續(xù)思維的表示,以提升LLM在不同任務(wù)中的適應(yīng)能力和推理效率。
總之,Coconut方法為提升大語言模型的推理能力提供了新的視角和方法,展現(xiàn)了潛在空間推理的巨大潛力。
聯(lián)系作者
文章來源:機(jī)器之心
作者微信:
作者簡(jiǎn)介:專業(yè)的人工智能媒體和產(chǎn)業(yè)服務(wù)平臺(tái)