重要的事情說(shuō)兩遍!Prompt「復(fù)讀機(jī)」,顯著提高LLM推理能力
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:重要的事情說(shuō)兩遍!Prompt「復(fù)讀機(jī)」,顯著提高LLM推理能力
關(guān)鍵字:問(wèn)題,數(shù)據(jù),提示,應(yīng)用題,模型
文章來(lái)源:新智元
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
新智元報(bào)道編輯:alan
【新智元導(dǎo)讀】盡管大模型能力非凡,但干細(xì)活的時(shí)候還是比不上人類。為了提高LLM的理解和推理能力,Prompt「復(fù)讀機(jī)」誕生了。眾所周知,人類的本質(zhì)是復(fù)讀機(jī)。
我們遵循復(fù)讀機(jī)的自我修養(yǎng):敲黑板,劃重點(diǎn),重要的事情說(shuō)三遍。
but,事實(shí)上同樣的方法對(duì)付AI也有奇效!
有研究證明,在提問(wèn)的時(shí)候故意重復(fù)一遍——也就是復(fù)制粘貼,即可顯著提高LLM的推理能力。
論文地址:https://arxiv.org/pdf/2309.06275
看下面的例子:
作者認(rèn)為,通常情況下,問(wèn)題中的重點(diǎn)token(比如這里的tennis balls)無(wú)法看到位于它后面的token(上圖)。
相比之下,使用重讀(re-reading,RE2)的方法,允許「tennis balls」在第二遍中看到自己對(duì)應(yīng)的整個(gè)問(wèn)題(How many tennis balls does he have now?),從而達(dá)到雙向理解的效果(下圖)。
實(shí)驗(yàn)表明,在14個(gè)數(shù)據(jù)集上的112個(gè)實(shí)驗(yàn)中,RE2技術(shù)都能帶來(lái)一致的性能提升,無(wú)論是經(jīng)過(guò)指令調(diào)整的模型(如ChatGPT),還是未經(jīng)調(diào)整的模型(如Llama)。
實(shí)
原文鏈接:重要的事情說(shuō)兩遍!Prompt「復(fù)讀機(jī)」,顯著提高LLM推理能力
聯(lián)系作者
文章來(lái)源:新智元
作者微信:
作者簡(jiǎn)介: