香港大學(xué)發(fā)布思維擴(kuò)散DoT，讓思維在時(shí)間上擴(kuò)散，提效保質(zhì)！

AIGC動態(tài)2年前 (2024)發(fā)布夕小瑤科技說

AIGC動態(tài)歡迎閱讀

原標(biāo)題：香港大學(xué)發(fā)布思維擴(kuò)散DoT，讓思維在時(shí)間上擴(kuò)散，提效保質(zhì)！
關(guān)鍵字：模型,能力,語言,性能,步驟
文章來源：夕小瑤科技說
內(nèi)容字?jǐn)?shù)：8792字

內(nèi)容摘要：

夕小瑤科技說原創(chuàng)編輯 | Tscom
引言：探索結(jié)合擴(kuò)散模型與思維鏈來提升大模型推理能力在人工智能領(lǐng)域，大語言模型（LLMs）已經(jīng)引起了廣泛的關(guān)注，它們在自然語言處理和機(jī)器學(xué)習(xí)的經(jīng)典問題上展現(xiàn)出了顯著的推理能力。特別是，思維鏈（Chain-of-Thought，CoT）技術(shù)已成為提升LLMs復(fù)雜推理過程的核心技術(shù)。同時(shí)，擴(kuò)散模型在文本處理方面的關(guān)注度也在不斷上升，它們在全局規(guī)劃能力和自我修正方面展現(xiàn)出了獨(dú)特的優(yōu)勢。
本文旨在探索擴(kuò)散模型與CoT技術(shù)結(jié)合的可能性，以及這種結(jié)合是否能夠增強(qiáng)復(fù)雜推理能力。我們提出了思維擴(kuò)散（Diffusion of Thought，DoT）方法，該方法允許推理步驟在擴(kuò)散過程中隨時(shí)間擴(kuò)散，從而提供了一種新的角度來理解和發(fā)展擴(kuò)散語言模型中的推理能力。
標(biāo)題：Diffusion of Thoughts: Chain-of-Thought Reasoning in Diffusion Language Models
論文鏈接: https://arxiv.org/pdf/2402.07754.pdf
擴(kuò)散模型與CoT技術(shù)的結(jié)合：Diffusion of Thoug

原文鏈接：香港大學(xué)發(fā)布思維擴(kuò)散DoT，讓思維在時(shí)間上擴(kuò)散，提效保質(zhì)！

聯(lián)系作者

文章來源：夕小瑤科技說
作者微信：xixiaoyaoQAQ
作者簡介：更快的AI前沿，更深的行業(yè)洞見。聚集25萬AI一線開發(fā)者、互聯(lián)網(wǎng)中高管和機(jī)構(gòu)投資人。一線作者來自清北、國內(nèi)外頂級AI實(shí)驗(yàn)室和大廠，兼?zhèn)湫袠I(yè)嗅覺與報(bào)道深度。

閱讀原文