DeepMind提出代碼鏈,通過(guò)“代碼思考”改進(jìn)推理性能

AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:DeepMind提出代碼鏈,通過(guò)“代碼思考”改進(jìn)推理性能
關(guān)鍵字:代碼,模型,語(yǔ)言,任務(wù),問(wèn)題
文章來(lái)源:夕小瑤科技說(shuō)
內(nèi)容字?jǐn)?shù):7419字
內(nèi)容摘要:夕小瑤科技說(shuō) 原創(chuàng)作者 | 智商掉了一地在未來(lái),如果想要精確地操控機(jī)器人,除了讓它理解簡(jiǎn)單易操作的指令,可能還需要一種更智能、可以理解復(fù)雜推理的方法來(lái)執(zhí)行指令。谷歌DeepMind最近提出了一個(gè)簡(jiǎn)單且高效的方法 Chain of Code(CoC),可以優(yōu)化大語(yǔ)言模型的代碼來(lái)驅(qū)動(dòng)推理。Chain of Code通過(guò)“以代碼方式思考”來(lái)拓寬語(yǔ)言模型正確回答推理問(wèn)題的范圍。Chain of Code的核心思想是鼓勵(lì)大語(yǔ)言模型 以一種靈活的偽代碼形式來(lái)表示語(yǔ)義子任務(wù)。通過(guò)采用這種偽代碼的形式,可以讓代碼解釋器清晰地捕捉到未定義的行為,并將其傳遞給語(yǔ)言模型進(jìn)行模擬(LMulator)。▲圖1 CoC 生成代碼并通過(guò)語(yǔ)言模型增強(qiáng)的代碼模擬器推理如圖 1 的結(jié)果展示,這項(xiàng)工作突顯了如何更好地結(jié)合代碼的結(jié)構(gòu)和計(jì)算能力以及語(yǔ)言模型的推理能力,實(shí)現(xiàn)了一個(gè)兼具兩者優(yōu)勢(shì)的推理器。論文題目: Chain of C…
原文鏈接:點(diǎn)此閱讀原文:DeepMind提出代碼鏈,通過(guò)“代碼思考”改進(jìn)推理性能
聯(lián)系作者
文章來(lái)源:夕小瑤科技說(shuō)
作者微信:xixiaoyaoQAQ
作者簡(jiǎn)介:更快的AI前沿,更深的行業(yè)洞見(jiàn)。聚集25萬(wàn)AI應(yīng)用開(kāi)發(fā)者、算法工程師和研究人員。一線作者均來(lái)自清北、國(guó)外頂級(jí)AI實(shí)驗(yàn)室和互聯(lián)網(wǎng)大廠,兼?zhèn)涿襟wsense與技術(shù)深度。

粵公網(wǎng)安備 44011502001135號(hào)