科普之旅：大語言模型的思維鏈

AIGC動(dòng)態(tài)10個(gè)月前發(fā)布大數(shù)據(jù)文摘

科普之旅：大語言模型的思維鏈

AIGC動(dòng)態(tài)歡迎閱讀

原標(biāo)題：科普之旅：大語言模型的思維鏈
關(guān)鍵字：模型,思維,問題,樣本,案例
文章來源：大數(shù)據(jù)文摘
內(nèi)容字?jǐn)?shù)：0字

內(nèi)容摘要：

大數(shù)據(jù)文摘受權(quán)轉(zhuǎn)載數(shù)據(jù)派THU
作者：胡赟豪
???在這個(gè)信息的時(shí)代，你是否曾幻想過與機(jī)器流暢交談，或是讓AI助你筆下生花，創(chuàng)作出驚艷的文章？這一切，都離不開大語言模型的神奇魔力。今天，讓我們一起揭開這層神秘的面紗，走進(jìn)大語言模型的科普奇幻之旅！一背景自大語言模型興起以來，人們通過不斷地增加參數(shù)量，使模型的效果得到一次又一次的躍升。但是，單純的增加參數(shù)量只能讓模型在閱讀理解、事實(shí)確認(rèn)等方面提升顯著，在邏輯推理、數(shù)學(xué)推理等復(fù)雜推理問題方面收益卻不大。
針對(duì)這一問題，一個(gè)直觀的改良方法就是微調(diào)（Finetune），通過引入大量“問題+答案”形式的樣本，對(duì)模型進(jìn)行訓(xùn)練迭代參數(shù)，從而讓模型專門提升這方面的能力。然而，這種方式在復(fù)雜推理等問題上帶來的效果依然有限，且需要大量的訓(xùn)練樣本。看起來模型在大量學(xué)習(xí)樣本之后，似乎也并沒有獲得推理的能力。究竟要怎樣才能讓模型真正學(xué)會(huì)推理呢？
二思維鏈?zhǔn)鞘裁矗考热荒Ｐ筒荒苤苯訌摹皢栴}+答案”中學(xué)習(xí)到推理邏輯，那么如果我們給出“問題+推理步驟+答案”，告訴模型最后的結(jié)果是怎么一步步推導(dǎo)出來的，是不是模型就可以學(xué)會(huì)了呢？
從這個(gè)想法出發(fā)，2022年谷歌發(fā)布

原文鏈接：科普之旅：大語言模型的思維鏈