<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        LLM推理性能受輸出格式影響,JSON最嚴重

        AIGC動態(tài)9個月前發(fā)布 量子位
        424 0 0

        LLM推理性能受輸出格式影響,JSON最嚴重

        AIGC動態(tài)歡迎閱讀

        原標題:LLM推理性能受輸出格式影響,JSON最嚴重
        關(guān)鍵字:格式,自然語言,模型,答案,問題
        文章來源:量子位
        內(nèi)容字數(shù):0字

        內(nèi)容摘要:


        一水 發(fā)自 凹非寺量子位 | 公眾號 QbitAI輸出格式不同,竟然還能影響大模型發(fā)揮?!
        兩種提示下讓大語言模型(LLMs)解同一道數(shù)學(xué)題,問題如下:
        Eliza每周工作的前40小時,每小時的工資是10美元,加班費每小時x1.2。如果Eliza這周工作了45小時,她這周的收入是多少?
        思維鏈prompt:“按照以下格式提供輸出,逐步推理:…回答:最終答案是…”。
        格式限制prompt:“按照以下有效的JSON格式提供輸出:…(具體JSON格式見圖)“。
        正確答案是460,可以看出,思維鏈(讓模型一步步思考)奏效,格式限制(“以JSON格式輸出”)卻失敗了!!
        這是大學(xué)和Appier AI Research新研究中的一幕,他們發(fā)現(xiàn)——
        格式限制這玩意兒會降低LLMs的推理能力,且限制越嚴推理越差。(主打一個叛逆)
        不過好消息是,能治。
        他們發(fā)現(xiàn),最佳解決方案是搞個“二次轉(zhuǎn)換”(倒爺是吧),即LLMs首先用自然語言回答問題,然后再將答案轉(zhuǎn)換為目標格式。
        在這個過程中,他們對比了GPT-3.5 Turbo、Claude 3 Haiku、Gemini 1.5 Flash等不同模型在生成不


        原文鏈接:LLM推理性能受輸出格式影響,JSON最嚴重

        聯(lián)系作者

        文章來源:量子位
        作者微信:
        作者簡介:

        閱讀原文
        ? 版權(quán)聲明
        Trae官網(wǎng)

        相關(guān)文章

        Trae官網(wǎng)

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 亚洲人成网站在线播放影院在线| 在线免费观看亚洲| 99久久成人国产精品免费| 亚洲VA中文字幕无码一二三区 | 久久精品亚洲精品国产色婷| 日本妇人成熟免费中文字幕 | 日日麻批免费40分钟日本的| 久久久久久久久无码精品亚洲日韩| 亚洲色婷婷综合久久| 国产精品永久免费10000| 国产精品亚洲二区在线| 亚洲AV无码国产在丝袜线观看| 免费精品国偷自产在线在线| yellow免费网站| 亚洲毛片基地4455ww| 亚洲人成无码久久电影网站| 免费A级毛片无码A∨免费| 毛片a级毛片免费播放下载| 成人片黄网站色大片免费观看cn| 亚洲国产精品xo在线观看| 亚洲国产中文字幕在线观看| 国产一卡二卡四卡免费| 一级成人生活片免费看| 亚洲综合无码无在线观看| 亚洲AV永久无码精品一百度影院| 国产免费观看a大片的网站| 最近在线2018视频免费观看| fc2免费人成在线视频| 亚洲熟妇成人精品一区| 亚洲好看的理论片电影| MM131亚洲国产美女久久| 好吊妞在线新免费视频| 免费无码VA一区二区三区| 无码日韩人妻AV一区免费l | 女人让男人免费桶爽30分钟| 久久国产乱子伦精品免费强| 免费人成视频在线观看免费| 亚洲av片不卡无码久久| 污视频网站免费在线观看| 亚洲免费网站在线观看| 亚洲avav天堂av在线不卡|