AIGC動態歡迎閱讀
原標題:一文回顧o1模型中CoT推理及其發展
關鍵字:模型,示例,提示,步驟,問題
文章來源:智猩猩GenAI
內容字數:0字
內容摘要:
大會預告12月5日-6日,2024中國生成式AI大會(上海站)將舉辦。上海科大助理教授、博導顧家遠,騰訊優圖實驗室天衍研究中心負責人吳賢,銀河通用機器人合伙人張直政,趣丸科技副總裁賈朔,曠視研究院高級研究員李華東已確認參會,將圍繞大模型、具身智能、AI視頻生成帶來分享,歡迎報名。LLM(大語言模型)或許已經深入讀者你生活的方方面面,但不可否認的是,LLM自身的不可解釋性和易產生幻覺等問題,使我們難以信任LLM生成的回答。同時,在強邏輯推斷、數學推斷等問題上,LLM的能力往往遠不及普通人類。但Openai o1模型的發布似乎讓這一切有了些許轉變。今天我們通過簡要介紹幾篇里程碑式的論文及其局限性,來盤一盤o1模型中起重要作用的CoT(思維鏈)的前世今生,讓大家更深入地理解這項技術。
首先我覺得需要澄清的是,CoT 并不是指某個或某類具體的技術,而是一種引導模型解決復雜問題的方。思維鏈的概念是由 Google 在 NIPS 2022 的論文 “Chain-of-Thought Prompting Elicits Reasoning in Large Language Models[1]”
原文鏈接:一文回顧o1模型中CoT推理及其發展
聯系作者
文章來源:智猩猩GenAI
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...