GPT-4合成！「角色調節」讓大模型輕松越獄，成功率暴漲40%，成本不到14元，馬庫斯轉贊

AIGC動態2年前 (2023)發布新智元

GPT-4合成冰毒！「角色調節」讓大模型輕松越獄，成功率暴漲40%，成本不到14元，馬庫斯轉贊

AIGC動態歡迎閱讀

原標題：GPT-4合成！「角色調節」讓大模型輕松越獄，成功率暴漲40%，成本不到14元，馬庫斯轉贊

文章來源：新智元

內容字數：4989字

內容摘要：新智元報道編輯：桃子【新智元導讀】讓大模型洗錢、制造、合成？GPT-4、 Claude 2紛紛淪陷了。讓大模型成功越獄，還是有機可乘。最近，研究人員研制了一種全新的自動化越獄的方法——「角色調節」（persona modulation）。它使用越獄模型作為助手，為特定的有害行為創建新的越獄。論文地址：https://arxiv.org/pdf/2311.03348.pdf值得一提的是，這個新方法只需要不到 2 美元，10分鐘即可進行15次越獄攻擊。結果發現，GPT-4自動攻擊的有害完成率為42.5%， Claude 2和Vicuna，有害完成率分別為61.0%和35.9%。看不夠熱鬧的馬庫斯也特意轉發了這篇論文，并表示：網絡欺凌、勒索、宗教不容忍、宣揚仇視、戀童癖，還是只想要制造或的說明書？ChatGPT都能幫你解決。Claude和Llama是如此。LLM自動越獄…

原文鏈接：點此閱讀原文：GPT-4合成！「角色調節」讓大模型輕松越獄，成功率暴漲40%，成本不到14元，馬庫斯轉贊