AIGC動態歡迎閱讀
原標題:解構思維之鏈、樹與圖:我們該如何優化大語言模型的推理能力?
關鍵字:拓撲,模型,思維,結構,節點
文章來源:夕小瑤科技說
內容字數:12346字
內容摘要:
夕小瑤科技說 原創作者 |小戲在浩浩蕩蕩的生物進化史中,人類的祖先“幸運”的抽中了一張名為“智能”的彩票。智能的出現讓人類擁有了思考的權力,而思維的思考所做的工作,無非又是推理二字。
大模型的出現,讓人們對智能的人造建構從卷積神經網絡、循環神經網絡實現的“感知”層面走向“認知”,在認知功能中,大模型展示的最為重要的能力,可能就是推理。在幾個月前,上交的張倬勝老師曾為我們帶來了一篇“從思維鏈(CoT)技術到 AI Agent 的綜述”
從宏觀層面而言,大模型推理能力的實現,是在解決問題的過程中通過構建一系列的推理節點(點)以及這些節點之間的依賴關系(邊)來形成一個有助于推理的結構化圖譜(這里就讓我們叫它推理拓撲,Topologies of Reasoning),這個推理拓撲即可以是鏈狀(CoT)、樹狀(ToT)結構,又可以是更復雜的圖狀(GoT)結構。
伴隨著大模型的快速發展,通過使用 Prompt 工程疊加這類推理結構圖譜的設計范式在提升模型推理能力、解決復雜任務方面展現出了巨大的潛力。為了加深對這一非常有趣又有前景的領域工作的理解,來自蘇黎世聯邦理工學院的學者們為我們深入細致的討論了
原文鏈接:解構思維之鏈、樹與圖:我們該如何優化大語言模型的推理能力?
聯系作者
文章來源:夕小瑤科技說
作者微信:xixiaoyaoQAQ
作者簡介:更快的AI前沿,更深的行業洞見。聚集25萬AI一線開發者、互聯網中高管和機構投資人。一線作者來自清北、國內外頂級AI實驗室和大廠,兼備行業嗅覺與報道深度。
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...