連續(xù)思維鏈：顛覆LLM推理的新紀(jì)元！

該研究可以通過(guò)梯度下降進(jìn)行端到端的優(yōu)化，因?yàn)檫B續(xù)思維是完全可微的。

原標(biāo)題：田淵棟團(tuán)隊(duì)論文火了！連續(xù)思維鏈優(yōu)于CoT，打開(kāi)LLM 推理新范式
文章來(lái)源：機(jī)器之心
內(nèi)容字?jǐn)?shù)：9402字

提升LLM推理能力的新方法：Coconut

近年來(lái)，隨著大語(yǔ)言模型（LLM）和思維鏈（CoT）的發(fā)展，語(yǔ)言已成為機(jī)器推理的主要媒介。然而，研究者們提出，語(yǔ)言空間并非始終是推理的最佳選擇。為此，Meta和加州大學(xué)圣地亞哥分校的研究團(tuán)隊(duì)提出了一種新方法——Coconut（連續(xù)思維鏈），旨在探索LLM在潛在空間中的推理能力。

1. Coconut方法概述

Coconut通過(guò)對(duì)傳統(tǒng)思維鏈的簡(jiǎn)單修改，解放了推理過(guò)程。該方法直接將最后的隱藏狀態(tài)作為下一個(gè)token的輸入，而不再依賴(lài)語(yǔ)言token。這種方法使得推理過(guò)程完全可微，能夠通過(guò)梯度下降進(jìn)行端到端優(yōu)化。

2. 實(shí)驗(yàn)設(shè)計(jì)與數(shù)據(jù)集

研究團(tuán)隊(duì)通過(guò)三個(gè)數(shù)據(jù)集驗(yàn)證了Coconut方法的有效性，包括數(shù)學(xué)推理任務(wù)（GSM8k）和邏輯推理任務(wù)（ProntoQA與ProsQA）。在實(shí)驗(yàn)中，團(tuán)隊(duì)使用預(yù)訓(xùn)練的GPT-2模型，并進(jìn)行多階段的漸進(jìn)式訓(xùn)練，逐步增加模型的推理難度。

3. 結(jié)果與討論

實(shí)驗(yàn)結(jié)果表明，Coconut顯著提高了LLM的推理能力，尤其在復(fù)雜的邏輯推理任務(wù)中表現(xiàn)優(yōu)于傳統(tǒng)的CoT方法。通過(guò)鏈?zhǔn)浇M合的連續(xù)思維，模型能夠在潛在空間中進(jìn)行高效推理，進(jìn)一步增強(qiáng)了其規(guī)劃能力。

4. 連續(xù)思維的優(yōu)勢(shì)

連續(xù)思維不僅能夠編碼多個(gè)潛在的下一個(gè)步驟，還能夠在推理過(guò)程中避免早期決策的困難。這種從發(fā)散到收斂的推理機(jī)制使得模型能夠更有效地處理復(fù)雜問(wèn)題，并且在需要大量規(guī)劃的任務(wù)中表現(xiàn)出色。

5. 未來(lái)研究方向

盡管Coconut方法取得了顯著成果，但研究者們指出，模型仍需指導(dǎo)來(lái)學(xué)習(xí)潛在空間的推理。未來(lái)的研究可以進(jìn)一步探索如何優(yōu)化這種連續(xù)思維的表示，以提升LLM在不同任務(wù)中的適應(yīng)能力和推理效率。

總之，Coconut方法為提升大語(yǔ)言模型的推理能力提供了新的視角和方法，展現(xiàn)了潛在空間推理的巨大潛力。

聯(lián)系作者

文章來(lái)源：機(jī)器之心
作者微信：
作者簡(jiǎn)介：專(zhuān)業(yè)的人工智能媒體和產(chǎn)業(yè)服務(wù)平臺(tái)

閱讀原文

# AIGC動(dòng)態(tài)# LLM # 人工智能 # 推理新范式 # 田淵棟團(tuán)隊(duì)# 連續(xù)思維鏈

? 版權(quán)聲明

文章版權(quán)歸作者所有，未經(jīng)允許請(qǐng)勿轉(zhuǎn)載。

暫無(wú)評(píng)論

暫無(wú)評(píng)論...

連續(xù)思維鏈：顛覆LLM推理的新紀(jì)元！

該研究可以通過(guò)梯度下降進(jìn)行端到端的優(yōu)化，因?yàn)檫B續(xù)思維是完全可微的。

提升LLM推理能力的新方法：Coconut

1. Coconut方法概述

2. 實(shí)驗(yàn)設(shè)計(jì)與數(shù)據(jù)集

3. 結(jié)果與討論

4. 連續(xù)思維的優(yōu)勢(shì)

5. 未來(lái)研究方向

聯(lián)系作者

史上最貴！首個(gè)AI Agent程序員商業(yè)化，比ChatGPT Pro貴2倍

150億美元估值、從20日活到2億月活，Discord做對(duì)了什么?

相關(guān)文章

暫無(wú)評(píng)論

ChatGPT

畢業(yè)論文生成器

AIGC熱點(diǎn)

連續(xù)思維鏈：顛覆LLM推理的新紀(jì)元！

該研究可以通過(guò)梯度下降進(jìn)行端到端的優(yōu)化，因?yàn)檫B續(xù)思維是完全可微的。

提升LLM推理能力的新方法：Coconut

1. Coconut方法概述

2. 實(shí)驗(yàn)設(shè)計(jì)與數(shù)據(jù)集

3. 結(jié)果與討論

4. 連續(xù)思維的優(yōu)勢(shì)

5. 未來(lái)研究方向

聯(lián)系作者

史上最貴！首個(gè)AI Agent程序員商業(yè)化，比ChatGPT Pro貴2倍

150億美元估值、從20日活到2億月活，Discord做對(duì)了什么?

相關(guān)文章

暫無(wú)評(píng)論

ChatGPT

畢業(yè)論文生成器

AIGC熱點(diǎn)

連續(xù)思維鏈：顛覆LLM推理的新紀(jì)元！

該研究可以通過(guò)梯度下降進(jìn)行端到端的優(yōu)化，因?yàn)檫B續(xù)思維是完全可微的。

史上最貴！首個(gè)AI Agent程序員商業(yè)化，比ChatGPT Pro貴2倍

150億美元估值、從20日活到2億月活，Discord做對(duì)了什么?