<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        北京大學:利用好不確定性,8B小模型也能超越GPT-4

        北京大學:利用好不確定性,8B小模型也能超越GPT-4

        AIGC動態(tài)歡迎閱讀

        原標題:北京大學:利用好不確定性,8B小模型也能超越GPT-4
        關(guān)鍵字:模型,性能,任務(wù),確定性,方法
        文章來源:夕小瑤科技說
        內(nèi)容字數(shù):0字

        內(nèi)容摘要:


        夕小瑤科技說 原創(chuàng)作者 | 謝年年大模型有一個顯著的特點,那就是不確定性——對于特定輸入,相同的LLM在不同解碼配置下可能生成顯著不同的輸出。
        比如問一問chatgpt“今天開心嗎?”,可以得到兩種不同的回答。
        常用的解碼策略有兩種,一個是貪婪解碼,即永遠選擇概率最高的下一個token,另一種就是采樣方法,根據(jù)概率分布隨機選擇下一個token,常常使用溫度參數(shù)平衡響應質(zhì)量和多樣性。
        那么,這兩種方式哪個更好呢?北大的一篇論文給出了答案:
        貪婪解碼在大多數(shù)任務(wù)中通常優(yōu)于采樣方法。
        另外作者還發(fā)現(xiàn),LLMs的這種不確定性具有巨大潛力。通過采用“Best-of-N”策略,從多個采樣響應中挑選最優(yōu)答案的方式,Llama-3-8B-Instruct在MMLU、GSM8K和HumanEval上均超越GPT-4-Turbo。
        這是否可以說明,即使小模型單次回答可能不夠準確,但多試幾次,從里面挑最好的,也能找到正確答案。就像多猜幾次謎語,總有一次能猜對一樣。一起來看看論文中怎么說的吧~
        論文標題:The Good, The Bad, and The Greedy:
        Evaluation of LLMs


        原文鏈接:北京大學:利用好不確定性,8B小模型也能超越GPT-4

        聯(lián)系作者

        文章來源:夕小瑤科技說
        作者微信:
        作者簡介:

        閱讀原文
        ? 版權(quán)聲明
        Trae官網(wǎng)

        相關(guān)文章

        Trae官網(wǎng)

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 亚洲国产高清在线| 精品国产亚洲AV麻豆| 毛片免费vip会员在线看| 亚洲av成人一区二区三区观看在线 | 亚洲国产V高清在线观看| 91视频免费观看| 丁香婷婷亚洲六月综合色| 亚洲国产精品人人做人人爱| 久草免费福利视频| 亚洲一线产品二线产品| 亚洲成Av人片乱码色午夜| 最近最新中文字幕完整版免费高清| 成人午夜免费视频| 亚洲AV一二三区成人影片| 国产综合亚洲专区在线| 一个人免费观看www视频在线| 亚洲免费视频一区二区三区| 亚洲国产人成在线观看| 亚洲婷婷五月综合狠狠爱| 成人黄动漫画免费网站视频| 男女午夜24式免费视频 | 成人爽a毛片免费| 羞羞的视频在线免费观看| 亚洲精品福利在线观看| 亚洲综合精品网站| 免费黄色app网站| 亚洲成人免费在线观看| EEUSS影院WWW在线观看免费| 亚洲综合欧美色五月俺也去| 亚洲AV美女一区二区三区| 亚洲国产精品人人做人人爱| 免费黄网在线观看| 免费国产成人高清在线观看网站| 国产真人无码作爱免费视频| 国产大陆亚洲精品国产| 亚洲国产成人精品激情| 久久亚洲日韩看片无码| 亚洲成亚洲乱码一二三四区软件| 亚洲成AⅤ人影院在线观看| 日韩免费视频播放| 毛片基地免费视频a|