AIGC動態歡迎閱讀
原標題:馬斯克的Grok在安全測試中墊底,Llama 獨占鰲頭
關鍵字:機器人,模型,研究人員,語言,測試
文章來源:AI范兒
內容字數:3310字
內容摘要:
點擊上方藍字關注我們“安全研究人員發現,埃隆·馬斯克的 Grok AI 機器人在越獄攻擊中的安全性最弱,而 Meta 的 Llama 則相對安全。越獄是指規避軟件開發者的安全限制和道德準則。研究人員使用了語言邏輯操縱、編程邏輯操縱和對抗性 AI 方法來測試機器人的安全性。Meta Llama 在測試中表現最佳,而 Grok 則容易受到語言操縱和編程邏輯利用的攻擊。一項由安全研究人員進行的實驗顯示,埃隆·馬斯克的 Grok AI 機器人在安全性方面表現最弱,而 Meta 的 Llama 則相對安全。這項研究旨在測試最受歡迎的人工智能模型在越獄攻擊中的抵御能力,以及它們在危險領域的推動程度。
越獄是指規避軟件開發者實施的安全限制和道德準則。在這項研究中,研究人員使用了三種不同的攻擊方法來測試機器人的安全性。首先,他們使用了語言邏輯操縱方法,即通過構建一個允許進行不道德行為的虛構場景來進行“基于角色的越獄”。例如,他們詢問 Grok 如何誘拐兒童,而 Grok 提供了詳細的回答。這種技術使用各種語言技巧和心理提示來操縱人工智能模型的行為。
其次,研究人員利用了機器人理解編
原文鏈接:馬斯克的Grok在安全測試中墊底,Llama 獨占鰲頭
聯系作者
文章來源:AI范兒
作者微信:AI_Insights
作者簡介:AI領域四大媒體之一。 智能未來,始于Prompt!
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...