百度馮景輝:從數(shù)據(jù)清洗到安全圍欄,深度解析大模型原生安全構(gòu)建
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:百度馮景輝:從數(shù)據(jù)清洗到安全圍欄,深度解析大模型原生安全構(gòu)建
關(guān)鍵字:模型,內(nèi)容,小米,數(shù)據(jù),字節(jié)跳動(dòng)
文章來(lái)源:AI前線
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
采訪嘉賓 | 馮景輝
策劃 | 李忠良
隨著大模型的逐步發(fā)展,內(nèi)容安全問(wèn)題受到了前所未有的關(guān)注。為此,InfoQ 特別邀請(qǐng)百度安全副總經(jīng)理馮景輝在 8 月 18-19 日的 AICon 全球人工智能大會(huì)(上海站)上,分享《百度大模型原生安全構(gòu)建之路》的主題演講。本文是對(duì)馮景輝的會(huì)前采訪對(duì)談。
在對(duì)談中,馮景輝提到,大模型的智能性、不確定性和不可解釋性為內(nèi)容安全帶來(lái)了重大挑戰(zhàn),這迫使開發(fā)者在模型設(shè)計(jì)階段就必須深入考慮安全性問(wèn)題。百度在這一領(lǐng)域進(jìn)行了多項(xiàng)創(chuàng)新實(shí)踐,包括數(shù)據(jù)清洗、安全對(duì)齊、內(nèi)生安全技術(shù)以及安全圍欄等措施,形成了一套完整的全流程安全解決方案。
特別值得一提的是,百度采用了四步法進(jìn)行數(shù)據(jù)清洗,并引入代答模型,以提高內(nèi)容審核的自動(dòng)化和智能化水平。馮景輝還強(qiáng)調(diào)了構(gòu)建原生安全的重要性,指出通過(guò)有監(jiān)督微調(diào)和人類反饋強(qiáng)化學(xué)習(xí)等技術(shù),可以顯著提升模型的安全性和可靠性。大模型安全的重要性與挑戰(zhàn)InfoQ:為什么要做大模型安全方面的內(nèi)容,可以看到許多企業(yè)現(xiàn)在專心在搞應(yīng)用,為安全買單的人都是哪些類型的?
馮景輝:過(guò)去若干年技術(shù)的發(fā)展,很少有像今天大模型一樣,從技術(shù)蓬勃發(fā)展的第一天開始,人們就如此重
原文鏈接:百度馮景輝:從數(shù)據(jù)清洗到安全圍欄,深度解析大模型原生安全構(gòu)建
聯(lián)系作者
文章來(lái)源:AI前線
作者微信:
作者簡(jiǎn)介: