谷歌推出前沿安全框架：評估AI模型嚴重風險，4個領域影響最大

AIGC動態2年前 (2024)發布智東西

AIGC動態歡迎閱讀

原標題：谷歌推出前沿安全框架：評估AI模型嚴重風險，4個領域影響最大
關鍵字：報告,模型,能力,框架,風險
文章來源：智東西
內容字數：4070字

內容摘要：

分析和減輕先進AI模型帶來的未來風險。
編譯|ZeR0
編輯|漠影
智東西5月18日消息，谷歌DeepMind昨晚推出AI前沿安全框架，并公布技術報告。??
前沿安全框架是一套協議，強調了在AI模型發展過程中識別和緩解潛在風險的重要性，旨在主動識別未來可能造成嚴重傷害的AI能力，并建立檢測和減輕它們的機制。
其計劃是到2025年初全面實施這一初步框架。該框架側重于模型級別的強大能力（如特殊機構或復雜的網絡能力）所導致的嚴重風險，對谷歌的一致性研究進行補充。
在技術報告中，值得關注的是，保護安全性方面的主要緩解風險措施是保護模型權重，這里的安全似乎更多跟商業秘密相掛鉤。
01.
三大關鍵組成：識別危害閾值，定期評估檢測，應用緩解措施
今天公布的第一版框架建立在谷歌對前沿模型中關鍵能力評估的研究基礎上，并遵循了負責任的能力擴展這一新興方法。
該框架有3個關鍵組成部分：
1、識別模型可能具有的嚴重危害的能力閾值。谷歌DeepMind研究了模型在高風險領域中可能造成嚴重傷害的路徑，然后確定模型在造成這種傷害中必須發揮作用的最小能力水平，被稱作“關鍵能力閾值”（CCLs），它們指導了谷歌Deep

原文鏈接：谷歌推出前沿安全框架：評估AI模型嚴重風險，4個領域影響最大