將慢思考蒸餾進(jìn)快思考,Meta 把 Llama2 躍升至 GPT-4 水平
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:將慢思考蒸餾進(jìn)快思考,Meta 把 Llama2 躍升至 GPT-4 水平
關(guān)鍵字:系統(tǒng),模型,解讀,數(shù)據(jù),任務(wù)
文章來源:Founder Park
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
《思考快與慢》中人類的兩種思考方式,屬實(shí)是被Meta給玩明白了。
研究人員通過把AI的“慢思考”結(jié)果蒸餾進(jìn)“快思考”,讓Llama2表現(xiàn)提升了257%,變得比GPT4還能打,同時(shí)還能降低推理成本。
這里的快慢兩種思考方式,指的就是2002年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主丹尼爾·卡尼曼推廣的系統(tǒng)1和系統(tǒng)2——
簡單說,系統(tǒng)1是簡單無意識(shí)的直覺,速度更快;
系統(tǒng)2則是復(fù)雜有意識(shí)的推理,準(zhǔn)確性更強(qiáng)。
Meta所做的“蒸餾”,就是用系統(tǒng)2生成數(shù)據(jù),然后對(duì)用系統(tǒng)1推理的模型進(jìn)行微調(diào)。
有網(wǎng)友看了后表示,這種模式和人類很像,一旦解決了一個(gè)難題,再解決(相似的問題)就變得簡單了。
文章轉(zhuǎn)載自「量子位」
01將系統(tǒng)2蒸餾到系統(tǒng)1對(duì)于大模型而言,模仿人類的“系統(tǒng)2”的方式有很多種,在模型中所處的環(huán)節(jié)也不盡相同,這里作者一共研究了四種:CoT,即Chain of Thought,思維鏈,從提示詞入手讓模型逐步思考;
S2A,即System 2 Attention,由Meta自己提出,直接修改了模型的注意力機(jī)制,屏蔽與任務(wù)無關(guān)的信息;
RaR,即Rephase and Respond,先對(duì)問題進(jìn)行重新表述,再根據(jù)重述后
原文鏈接:將慢思考蒸餾進(jìn)快思考,Meta 把 Llama2 躍升至 GPT-4 水平
聯(lián)系作者
文章來源:Founder Park
作者微信:Founder-Park
作者簡介:來自極客公園,專注與科技創(chuàng)業(yè)者聊「真問題」。