科普之旅 :大語言模型的思維鏈
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:科普之旅 :大語言模型的思維鏈
關(guān)鍵字:模型,思維,問題,樣本,案例
文章來源:大數(shù)據(jù)文摘
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
大數(shù)據(jù)文摘受權(quán)轉(zhuǎn)載數(shù)據(jù)派THU
作者:胡赟豪
???在這個(gè)信息的時(shí)代,你是否曾幻想過與機(jī)器流暢交談,或是讓AI助你筆下生花,創(chuàng)作出驚艷的文章?這一切,都離不開大語言模型的神奇魔力。今天,讓我們一起揭開這層神秘的面紗,走進(jìn)大語言模型的科普奇幻之旅!一 背景自大語言模型興起以來,人們通過不斷地增加參數(shù)量,使模型的效果得到一次又一次的躍升。但是,單純的增加參數(shù)量只能讓模型在閱讀理解、事實(shí)確認(rèn)等方面提升顯著,在邏輯推理、數(shù)學(xué)推理等復(fù)雜推理問題方面收益卻不大。
針對(duì)這一問題,一個(gè)直觀的改良方法就是微調(diào)(Finetune),通過引入大量“問題+答案”形式的樣本,對(duì)模型進(jìn)行訓(xùn)練迭代參數(shù),從而讓模型專門提升這方面的能力。然而,這種方式在復(fù)雜推理等問題上帶來的效果依然有限,且需要大量的訓(xùn)練樣本。看起來模型在大量學(xué)習(xí)樣本之后,似乎也并沒有獲得推理的能力。究竟要怎樣才能讓模型真正學(xué)會(huì)推理呢?
二 思維鏈?zhǔn)鞘裁矗考热荒P筒荒苤苯訌摹皢栴}+答案”中學(xué)習(xí)到推理邏輯,那么如果我們給出“問題+推理步驟+答案”,告訴模型最后的結(jié)果是怎么一步步推導(dǎo)出來的,是不是模型就可以學(xué)會(huì)了呢?
從這個(gè)想法出發(fā),2022年谷歌發(fā)布
原文鏈接:科普之旅 :大語言模型的思維鏈
聯(lián)系作者
文章來源:大數(shù)據(jù)文摘
作者微信:BigDataDigest
作者簡介:普及數(shù)據(jù)思維,傳播數(shù)據(jù)文化