<label id="3dn8r"><mark id="3dn8r"></mark></label>

<span id="3dn8r"></span>

<span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

北京大學：利用好不確定性，8B小模型也能超越GPT-4

AIGC動態(tài)9個月前發(fā)布夕小瑤科技說

391 0 0

北京大學：利用好不確定性，8B小模型也能超越GPT-4

AIGC動態(tài)歡迎閱讀

原標題：北京大學：利用好不確定性，8B小模型也能超越GPT-4
關(guān)鍵字：模型,性能,任務(wù),確定性,方法
文章來源：夕小瑤科技說
內(nèi)容字數(shù)：0字

內(nèi)容摘要：

夕小瑤科技說原創(chuàng)作者 | 謝年年大模型有一個顯著的特點，那就是不確定性——對于特定輸入，相同的LLM在不同解碼配置下可能生成顯著不同的輸出。
比如問一問chatgpt“今天開心嗎？”，可以得到兩種不同的回答。
常用的解碼策略有兩種，一個是貪婪解碼，即永遠選擇概率最高的下一個token，另一種就是采樣方法，根據(jù)概率分布隨機選擇下一個token，常常使用溫度參數(shù)平衡響應質(zhì)量和多樣性。
那么，這兩種方式哪個更好呢？北大的一篇論文給出了答案：
貪婪解碼在大多數(shù)任務(wù)中通常優(yōu)于采樣方法。
另外作者還發(fā)現(xiàn)，LLMs的這種不確定性具有巨大潛力。通過采用“Best-of-N”策略，從多個采樣響應中挑選最優(yōu)答案的方式，Llama-3-8B-Instruct在MMLU、GSM8K和HumanEval上均超越GPT-4-Turbo。
這是否可以說明，即使小模型單次回答可能不夠準確，但多試幾次，從里面挑最好的，也能找到正確答案。就像多猜幾次謎語，總有一次能猜對一樣。一起來看看論文中怎么說的吧~
論文標題:The Good, The Bad, and The Greedy:
Evaluation of LLMs

原文鏈接：北京大學：利用好不確定性，8B小模型也能超越GPT-4

聯(lián)系作者

文章來源：夕小瑤科技說
作者微信：
作者簡介：

# AIGC動態(tài)# 任務(wù)# 性能 # 方法 # 模型 # 確定性

? 版權(quán)聲明

文章版權(quán)歸作者所有，未經(jīng)允許請勿轉(zhuǎn)載。

Trae官網(wǎng)

相關(guān)文章

Trae官網(wǎng)

暫無評論

暫無評論...

打開我，進入AI時代。
全面、高效的AI工具產(chǎn)品情報，發(fā)現(xiàn)和使用最酷的AI工具！
Ctrl + D 或 ? + D 收藏本站到瀏覽器書簽欄。

OpenI AI助手在線工具硅基流動豆包 Trae 扣子Coze 即夢繪蛙

Copyright ? 2025 OpenI 粵ICP備19001258號

粵公網(wǎng)安備 44011502001135號 SiteMap XML

主站蜘蛛池模板：人妻丰满熟妇无码区免费| 啦啦啦高清视频在线观看免费 | 国产人成亚洲第一网站在线播放| 四虎www成人影院免费观看| 一级做a爰片性色毛片免费网站| 精品亚洲一区二区| 免费看韩国黄a片在线观看| 一级特黄色毛片免费看| 亚洲福利电影一区二区?| 免费人成在线观看视频播放| 久久久国产精品无码免费专区| 亚洲最大天堂无码精品区| 国产亚洲精品激情都市| 精品熟女少妇AV免费观看| 国产裸体美女永久免费无遮挡| 亚洲春色另类小说| 国产亚洲精品无码拍拍拍色欲| 亚洲成人免费网站| 久久精品无码专区免费| 一本色道久久88—综合亚洲精品 | 91在线精品亚洲一区二区| 国产精品美女自在线观看免费| 久久久久国产精品免费网站| 羞羞视频免费网站入口| 亚洲精品欧洲精品| 亚洲综合伊人久久大杳蕉| 成人a视频片在线观看免费| 人人玩人人添人人澡免费| 国产成人不卡亚洲精品91| 亚洲午夜精品在线| 亚洲AV无码一区二区三区系列 | 亚洲精品在线播放视频| 久久亚洲精品无码观看不卡| 毛片免费视频观看| 91久久青青草原线免费| 伊人免费在线观看高清版| 国产成人亚洲精品无码AV大片| 456亚洲人成影院在线观| 亚洲AV无码一区二区二三区入口| 亚洲国产成人久久综合一区77| 成人毛片18女人毛片免费96|