<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        慢思考準確率反降30%!普林斯頓揭示思維鏈某些任務上失效的秘密

        AIGC動態11個月前發布 量子位
        468 0 0

        慢思考準確率反降30%!普林斯頓揭示思維鏈某些任務上失效的秘密

        AIGC動態歡迎閱讀

        原標題:慢思考準確率反降30%!普林斯頓揭示思維鏈某些任務上失效的秘密
        關鍵字:模型,人類,任務,提示,參與者
        文章來源:量子位
        內容字數:0字

        內容摘要:


        夢晨 發自 凹非寺量子位 | 公眾號 QbitAIOpenAI o1徹底帶火慢思考和思維鏈(CoT)方法,但CoT在某些任務上反而會降低模型表現。
        比如給生造的詞分類任務,GPT-4在zero-shot提示下的準確率高達94%,換成CoT的準確率卻到64.4%。
        內置CoT的o1-preview準確率更是只有57.7%。
        CoT究竟會“搞砸”哪些任務,在學術界仍是一個懸而未決的問題。
        現在,普林斯頓計算機系與心理系合作,確定了其中一些任務的特征:人類深思熟慮或被要求解釋自己的思路時,也會降低在這些任務上的表現。
        新論文“一步一步想,但小心腳下”已上傳到arXiv。
        心理學探索思維鏈掉鏈子原因為了縮小要探索的范圍,團隊在CoT提示和人類進行語言思考之間進行了類比。
        大模型和人類具能力有著根本不同,因此影響表現的約束因素也不同。如大模型的上下文長度很長,遠遠超出了人類的記憶限制。
        因此,團隊預計CoT將在以下情況下損害模型性能:
        (i) 深思熟慮會損害人類的表現(ii) 影響人類在任務上表現的約束條件,可以普遍性地推廣到大模型。
        在實驗中,選擇了心理學文獻中的6項任務,其中隱式統


        原文鏈接:慢思考準確率反降30%!普林斯頓揭示思維鏈某些任務上失效的秘密

        聯系作者

        文章來源:量子位
        作者微信:
        作者簡介:

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 无套内射无矿码免费看黄| 亚洲精品国产美女久久久| 久久综合亚洲色一区二区三区| 一级中文字幕乱码免费| 又大又粗又爽a级毛片免费看| 亚洲色欲色欲www在线播放 | 久久亚洲精品无码gv| 成人免费无毒在线观看网站| 亚洲xxxxxx| 欧洲精品成人免费视频在线观看| 精品亚洲AV无码一区二区 | 亚洲AV无码国产精品色午友在线| 久久久免费观成人影院| 亚洲精品国产精品乱码在线观看| 免费视频专区一国产盗摄| 亚洲无码一区二区三区| 中文字幕人成人乱码亚洲电影| 国内精品久久久久影院免费| 亚洲视频日韩视频| 亚洲精品岛国片在线观看| 黄 色一级 成 人网站免费| 亚洲字幕在线观看| 日韩免费视频网站| 男女啪啪免费体验区| 亚洲成人网在线播放| 亚洲精品中文字幕无码蜜桃| 嫩草影院免费观看| 免费人成又黄又爽的视频在线电影| 久久久久亚洲精品成人网小说| 99在线精品视频观看免费| 亚洲av成人片在线观看| 久久亚洲精品中文字幕| 成人毛片18女人毛片免费视频未| 最近免费中文字幕MV在线视频3| 亚洲an日韩专区在线| 亚洲精品中文字幕无码蜜桃| 亚洲精品无码专区2| 国产一区二区三区在线免费观看| 国内精品免费在线观看| 九九九精品视频免费| 国产精品观看在线亚洲人成网|