<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        慢思考準確率反降30%!普林斯頓揭示思維鏈某些任務上失效的秘密

        AIGC動態6個月前發布 量子位
        463 0 0

        慢思考準確率反降30%!普林斯頓揭示思維鏈某些任務上失效的秘密

        AIGC動態歡迎閱讀

        原標題:慢思考準確率反降30%!普林斯頓揭示思維鏈某些任務上失效的秘密
        關鍵字:模型,人類,任務,提示,參與者
        文章來源:量子位
        內容字數:0字

        內容摘要:


        夢晨 發自 凹非寺量子位 | 公眾號 QbitAIOpenAI o1徹底帶火慢思考和思維鏈(CoT)方法,但CoT在某些任務上反而會降低模型表現。
        比如給生造的詞分類任務,GPT-4在zero-shot提示下的準確率高達94%,換成CoT的準確率卻到64.4%。
        內置CoT的o1-preview準確率更是只有57.7%。
        CoT究竟會“搞砸”哪些任務,在學術界仍是一個懸而未決的問題。
        現在,普林斯頓計算機系與心理系合作,確定了其中一些任務的特征:人類深思熟慮或被要求解釋自己的思路時,也會降低在這些任務上的表現。
        新論文“一步一步想,但小心腳下”已上傳到arXiv。
        心理學探索思維鏈掉鏈子原因為了縮小要探索的范圍,團隊在CoT提示和人類進行語言思考之間進行了類比。
        大模型和人類具能力有著根本不同,因此影響表現的約束因素也不同。如大模型的上下文長度很長,遠遠超出了人類的記憶限制。
        因此,團隊預計CoT將在以下情況下損害模型性能:
        (i) 深思熟慮會損害人類的表現(ii) 影響人類在任務上表現的約束條件,可以普遍性地推廣到大模型。
        在實驗中,選擇了心理學文獻中的6項任務,其中隱式統


        原文鏈接:慢思考準確率反降30%!普林斯頓揭示思維鏈某些任務上失效的秘密

        聯系作者

        文章來源:量子位
        作者微信:
        作者簡介:

        閱讀原文
        ? 版權聲明
        Trae官網

        相關文章

        Trae官網

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 国产精品自在自线免费观看| 在线观看亚洲AV日韩A∨| 色www永久免费视频| 久久99精品视免费看| eeuss影院免费92242部| 亚洲av无码专区在线电影| 亚洲国产精品综合久久久| 亚洲中文字幕无码久久精品1| 国产美女做a免费视频软件| 67194熟妇在线永久免费观看| 你懂的网址免费国产| 免费无码午夜福利片69| 亚洲欧洲AV无码专区| 亚洲男人的天堂久久精品 | 一本一道dvd在线观看免费视频| 亚洲综合一区二区三区四区五区| 亚洲男人天堂av| 亚洲成av人在线视| 亚洲精品少妇30p| 亚洲一区二区三区在线视频| 国产国产成年年人免费看片| 久久久久国色AV免费看图片| 国产高清免费视频| 91嫩草免费国产永久入口| 日韩中文字幕免费视频| 99爱免费观看视频在线| 久久久精品午夜免费不卡| 97人妻精品全国免费视频 | 亚洲av永久无码制服河南实里| 国内精品久久久久久久亚洲| 亚洲国产成人久久综合野外| 日韩亚洲国产二区| 亚洲av日韩片在线观看| 免费成人午夜视频| 亚洲国产综合精品一区在线播放| 亚洲免费日韩无码系列| 久久久久亚洲?V成人无码| 亚洲精品国精品久久99热一| 亚洲国产精品福利片在线观看| 国产成人无码综合亚洲日韩 | 四虎永久在线精品免费观看视频|