AIGC動態歡迎閱讀
原標題:深度揭秘CoT!普林斯頓耶魯發布最新報告:大模型既有記憶推理、也有概率推理
關鍵字:概率,模型,準確率,報告,任務
文章來源:新智元
內容字數:0字
內容摘要:
新智元報道編輯:LRS
【新智元導讀】研究人員通過案例研究,利用大型語言模型(LLMs)如GPT-4、Claude 3和Llama 3.1,探索了思維鏈(CoT)提示在解碼移位密碼任務中的表現;CoT提示雖然提升了模型的推理能力,但這種能力并非純粹的符號推理,而是結合了記憶和概率推理的復雜過程。「推理」是非常能展現「人類智能」的一項能力,需要結合現有證據和過去的經驗,以邏輯和系統的方式思考某件事情,進而做出決策。
大型語言模型(LLMs)以其通用性,在多項任務上都取得了出色的性能,雖然思維鏈(CoT)提示已經證明了大模型具備多步推理能力,但這種能力到底來自于「抽象泛化」(abstract generalization)還是「淺層啟發式」(shallow heuristics),仍然沒有定論。
為了深入理解影響 CoT 推理的因素,普林斯頓大學、耶魯大學的研究人員最近發布了一項案例研究,使用三個大模型(GPT-4、Claude 3 和 Llama 3.1)利用CoT提示來執行解碼移位密碼(decoding shift ciphers)的符號推理任務。論文地址:https://arxiv
原文鏈接:深度揭秘CoT!普林斯頓耶魯發布最新報告:大模型既有記憶推理、也有概率推理
聯系作者
文章來源:新智元
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...