<label id="3dn8r"><mark id="3dn8r"></mark></label>

<span id="3dn8r"></span>

<span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

<input id="oiwg6"></input>

<bdo id="oiwg6"></bdo>

<cite id="oiwg6"><tbody id="oiwg6"></tbody></cite>

<cite id="oiwg6"><tbody id="oiwg6"></tbody></cite>

<abbr id="oiwg6"></abbr>

<blockquote id="oiwg6"><th id="oiwg6"></th></blockquote>

慢思考準確率反降30%！普林斯頓揭示思維鏈某些任務上失效的秘密

AIGC動態6個月前發布量子位

463 0 0

慢思考準確率反降30%！普林斯頓揭示思維鏈某些任務上失效的秘密

AIGC動態歡迎閱讀

原標題：慢思考準確率反降30%！普林斯頓揭示思維鏈某些任務上失效的秘密
關鍵字：模型,人類,任務,提示,參與者
文章來源：量子位
內容字數：0字

內容摘要：

夢晨發自凹非寺量子位 | 公眾號 QbitAIOpenAI o1徹底帶火慢思考和思維鏈（CoT）方法，但CoT在某些任務上反而會降低模型表現。
比如給生造的詞分類任務，GPT-4在zero-shot提示下的準確率高達94%，換成CoT的準確率卻到64.4%。
內置CoT的o1-preview準確率更是只有57.7%。
CoT究竟會“搞砸”哪些任務，在學術界仍是一個懸而未決的問題。
現在，普林斯頓計算機系與心理系合作，確定了其中一些任務的特征：人類深思熟慮或被要求解釋自己的思路時，也會降低在這些任務上的表現。
新論文“一步一步想，但小心腳下”已上傳到arXiv。
心理學探索思維鏈掉鏈子原因為了縮小要探索的范圍，團隊在CoT提示和人類進行語言思考之間進行了類比。
大模型和人類具能力有著根本不同，因此影響表現的約束因素也不同。如大模型的上下文長度很長，遠遠超出了人類的記憶限制。
因此，團隊預計CoT將在以下情況下損害模型性能：
（i）深思熟慮會損害人類的表現（ii）影響人類在任務上表現的約束條件，可以普遍性地推廣到大模型。
在實驗中，選擇了心理學文獻中的6項任務，其中隱式統

原文鏈接：慢思考準確率反降30%！普林斯頓揭示思維鏈某些任務上失效的秘密

聯系作者

文章來源：量子位
作者微信：
作者簡介：

# AIGC動態 # 人類 # 任務 # 參與者 # 提示 # 模型

? 版權聲明

文章版權歸作者所有，未經允許請勿轉載。

Trae官網

相關文章

Trae官網

暫無評論

暫無評論...

主站蜘蛛池模板：国产精品自在自线免费观看| 在线观看亚洲AV日韩A∨| 色www永久免费视频| 久久99精品视免费看| eeuss影院免费92242部| 亚洲av无码专区在线电影| 亚洲国产精品综合久久久| 亚洲中文字幕无码久久精品1| 国产美女做a免费视频软件| 67194熟妇在线永久免费观看| 你懂的网址免费国产| 免费无码午夜福利片69| 亚洲欧洲AV无码专区| 亚洲男人的天堂久久精品 | 一本一道dvd在线观看免费视频| 亚洲综合一区二区三区四区五区| 亚洲男人天堂av| 亚洲成av人在线视| 亚洲精品少妇30p| 亚洲一区二区三区在线视频| 国产国产成年年人免费看片| 久久久久国色AV免费看图片| 国产高清免费视频| 91嫩草免费国产永久入口| 日韩中文字幕免费视频| 99爱免费观看视频在线| 久久久精品午夜免费不卡| 97人妻精品全国免费视频 | 亚洲av永久无码制服河南实里| 国内精品久久久久久久亚洲| 亚洲国产成人久久综合野外| 日韩亚洲国产二区| 亚洲av日韩片在线观看| 免费成人午夜视频| 亚洲国产综合精品一区在线播放| 亚洲免费日韩无码系列| 久久久久亚洲?V成人无码| 亚洲精品国精品久久99热一| 亚洲国产精品福利片在线观看| 国产成人无码综合亚洲日韩 | 四虎永久在线精品免费观看视频|

<rt id="gki2a"><samp id="gki2a"></samp></rt>

<rt id="gki2a"><tbody id="gki2a"></tbody></rt>

<s id="gki2a"><dd id="gki2a"></dd></s>