GPT-4完全版：用最新官方API微調，想干啥就干啥，網友怕了

AIGC動態2年前 (2023)發布機器之心

GPT-4完全破解版：用最新官方API微調，想干啥就干啥，網友怕了

AIGC動態歡迎閱讀

原標題：GPT-4完全版：用最新官方API微調，想干啥就干啥，網友怕了
關鍵字：報告,模型,研究者,函數,數據
文章來源：機器之心
內容字數：9052字

內容摘要：

機器之心報道
編輯：澤南、蛋醬灰盒訪問，十幾步消除 GPT-4 核心保護措施。只要使用最新的微調 API，GPT-4 就可以幫你干任何事，輸出有害信息，或是訓練數據中的個人隱私。
本周二，一篇來自 FAR AI、麥吉爾大學等機構的研究引發了 AI 研究社區的廣泛擔憂。
研究人員試圖對 GPT-4 最新上線的幾種 API 進行攻擊，想繞過安全機制，使其完成通常不被允許的各種任務，結果發現所有 API 都能被攻破，被后的 GPT-4 可以回應任何請求。
這種「」的程度，遠遠超過了攻擊者的預料。有人總結道：現在大模型可以生成針對公眾人物的錯誤信息、個人電子郵件地址、惡意 URL，允許任意未經過濾的函數調用，誤導用戶或執行不需要的函數調用……還記得之前人們輸入大量重復性語句，GPT 會隨機泄露帶個人信息的訓練數據嗎？現在你不需要做漫無目的的嘗試，想讓最新版的 GPT 干什么，它就會做什么。
以至于有網友表示，我們一直認為 ChatGPT 能力爆發背后的「功臣」，基于人類反饋的強化學習 RLHF 怕不是萬惡之源。這篇論文《Exploiting Novel GPT-4 APIs》也成為了

原文鏈接：GPT-4完全版：用最新官方API微調，想干啥就干啥，網友怕了