淺談大模型 SFT 的實(shí)踐落地:10 問 10 答

AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:淺談大模型 SFT 的實(shí)踐落地:10 問 10 答
關(guān)鍵字:模型,數(shù)據(jù),任務(wù),解讀,報(bào)告
文章來源:算法邦
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
來源|知乎—周星星
地址|https://zhuanlan.zhihu.com/p/685582706
前言SFT 是“低端”的工作,但它與業(yè)務(wù)緊密相連。相較于難以實(shí)施且多數(shù)公司沒資源訓(xùn)練的預(yù)訓(xùn)練,以及調(diào)試難度高的強(qiáng)化學(xué)習(xí),SFT 可謂效果立竿見影,SFT在實(shí)際應(yīng)用中更易顯現(xiàn)成效。
本文關(guān)注如何通過 SFT 逼近大模型的表現(xiàn),既確保效果又兼顧模型的泛化能力,從而滿足業(yè)務(wù)需求,實(shí)現(xiàn)大模型的有效落地。接下來,我將采用 10 問 10 答的分享分享一些經(jīng)驗(yàn),這些經(jīng)驗(yàn)源自實(shí)際業(yè)務(wù)中的實(shí)踐、社區(qū)的交流和 閱讀過的 Paper 中,不斷總結(jié)出來的個(gè)人心得,這些經(jīng)驗(yàn)也會(huì)隨時(shí)間不斷更新。期待與大家的交流探討。
Q1: 常見 SFT的開發(fā)流程是如何的?第一步,根據(jù)業(yè)務(wù)場(chǎng)景調(diào)整提示詞(prompt):業(yè)務(wù)團(tuán)隊(duì)會(huì)提供具體場(chǎng)景,或者給出他們編寫的prompt,也可能只提供場(chǎng)景和數(shù)據(jù),需要算法工程師自行編寫。編寫優(yōu)秀的 prompt 對(duì)發(fā)揮模型的最大性能至關(guān)重要,一個(gè)出色的 prompt 可能將性能提升至80分以上直接得到業(yè)務(wù)要求,而一個(gè)普通的prompt可能只能得到50分。這里可以參考 OpenAI 和文心一
原文鏈接:淺談大模型 SFT 的實(shí)踐落地:10 問 10 答
聯(lián)系作者
文章來源:算法邦
作者微信:allplusai
作者簡(jiǎn)介:智猩猩矩陣賬號(hào)之一,聚焦生成式AI,重點(diǎn)關(guān)注模型與應(yīng)用。

粵公網(wǎng)安備 44011502001135號(hào)