谷歌推出前沿安全框架:評估AI模型嚴(yán)重風(fēng)險(xiǎn),4個領(lǐng)域影響最大
AIGC動態(tài)歡迎閱讀
原標(biāo)題:谷歌推出前沿安全框架:評估AI模型嚴(yán)重風(fēng)險(xiǎn),4個領(lǐng)域影響最大
關(guān)鍵字:報(bào)告,模型,能力,框架,風(fēng)險(xiǎn)
文章來源:智東西
內(nèi)容字?jǐn)?shù):4070字
內(nèi)容摘要:
分析和減輕先進(jìn)AI模型帶來的未來風(fēng)險(xiǎn)。
編譯|ZeR0
編輯|漠影
智東西5月18日消息,谷歌DeepMind昨晚推出AI前沿安全框架,并公布技術(shù)報(bào)告。??
前沿安全框架是一套協(xié)議,強(qiáng)調(diào)了在AI模型發(fā)展過程中識別和緩解潛在風(fēng)險(xiǎn)的重要性,旨在主動識別未來可能造成嚴(yán)重傷害的AI能力,并建立檢測和減輕它們的機(jī)制。
其計(jì)劃是到2025年初全面實(shí)施這一初步框架。該框架側(cè)重于模型級別的強(qiáng)大能力(如特殊機(jī)構(gòu)或復(fù)雜的網(wǎng)絡(luò)能力)所導(dǎo)致的嚴(yán)重風(fēng)險(xiǎn),對谷歌的一致性研究進(jìn)行補(bǔ)充。
在技術(shù)報(bào)告中,值得關(guān)注的是,保護(hù)安全性方面的主要緩解風(fēng)險(xiǎn)措施是保護(hù)模型權(quán)重,這里的安全似乎更多跟商業(yè)秘密相掛鉤。
01.
三大關(guān)鍵組成:識別危害閾值,定期評估檢測,應(yīng)用緩解措施
今天公布的第一版框架建立在谷歌對前沿模型中關(guān)鍵能力評估的研究基礎(chǔ)上,并遵循了負(fù)責(zé)任的能力擴(kuò)展這一新興方法。
該框架有3個關(guān)鍵組成部分:
1、識別模型可能具有的嚴(yán)重危害的能力閾值。谷歌DeepMind研究了模型在高風(fēng)險(xiǎn)領(lǐng)域中可能造成嚴(yán)重傷害的路徑,然后確定模型在造成這種傷害中必須發(fā)揮作用的最小能力水平,被稱作“關(guān)鍵能力閾值”(CCLs),它們指導(dǎo)了谷歌Deep
原文鏈接:谷歌推出前沿安全框架:評估AI模型嚴(yán)重風(fēng)險(xiǎn),4個領(lǐng)域影響最大
聯(lián)系作者
文章來源:智東西
作者微信:zhidxcom
作者簡介:智能產(chǎn)業(yè)新媒體!智東西專注報(bào)道人工智能主導(dǎo)的前沿技術(shù)發(fā)展,和技術(shù)應(yīng)用帶來的千行百業(yè)產(chǎn)業(yè)升級。聚焦智能變革,服務(wù)產(chǎn)業(yè)升級。