<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        用深度催眠誘導LLM「越獄」,香港浸會大學初探可信大語言模型

        AIGC動態2年前 (2023)發布 機器之心
        522 0 0

        用深度催眠誘導LLM「越獄」,香港浸會大學初探可信大語言模型

        AIGC動態歡迎閱讀

        原標題:用深度催眠誘導LLM「越獄」,香港浸會大學初探可信大語言模型

        關鍵字:指令,模型,嵌套,誘導,場景

        文章來源:機器之心

        內容字數:9148字

        內容摘要:機器之心專欄作者:Xuan Li、 Zhanke Zhou、Jianing Zhu機構:HKBU TMLR Group盡管大語言模型 LLM (Large Language Model) 在各種應用中取得了巨大成功,但它也容易受到一些 Prompt 的誘導,從而越過模型內置的安全防護提供一些危險 / 違法內容,即 Jailbreak。深入理解這類 Jailbreak 的原理,加強相關研究,可反向促進人們對大模型安全性防護的重視,完善大模型的防御機制。不同于以往采用搜索優化或計算成本較高的推斷方法來生成可 Jailbreak 的 Prompt,本文受米爾格拉姆實驗(Milgram experiment)啟發,從心理學視角提出了一種輕量級 Jailbreak 方法:DeepInception,通過深度催眠 LLM 使其成為越獄者,并令其自行規避內置的安全防護。論文鏈接:https://arxi…

        原文鏈接:點此閱讀原文:用深度催眠誘導LLM「越獄」,香港浸會大學初探可信大語言模型

        聯系作者

        文章來源:機器之心

        作者微信:almosthuman2014

        作者簡介:專業的人工智能媒體和產業服務平臺

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 亚洲美女中文字幕| 国产亚洲精品资源在线26u| 亚洲伊人tv综合网色| 中文字幕久无码免费久久 | 国产三级在线观看免费| 久久精品蜜芽亚洲国产AV| 久久国产免费观看精品3| jizz中国免费| 日韩精品无码区免费专区| 亚洲不卡中文字幕| 18禁无遮挡无码网站免费| 色老板亚洲视频免在线观| 日韩精品成人无码专区免费 | 久久久无码精品亚洲日韩蜜桃| 9久热精品免费观看视频| 精品久久久久久亚洲| 国内精品免费视频精选在线观看 | 最近中文字幕完整版免费高清 | 美女被羞羞网站免费下载| 亚洲一区二区三区国产精品| a级在线观看免费| 亚洲精品无码久久久久久久| 免费可以在线看A∨网站| 黄人成a动漫片免费网站| 亚洲精品无码MV在线观看| 亚洲免费在线播放| 亚洲乱码一二三四区乱码| 免费一级毛片在线观看| 国产视频精品免费视频| 久久久婷婷五月亚洲97号色| 麻豆国产入口在线观看免费| 亚洲综合激情九月婷婷| 好吊妞788免费视频播放| 久青草国产免费观看| 久久亚洲AV无码精品色午夜麻| 九九精品免费视频| 大片免费观看92在线视频线视频 | 一边摸一边桶一边脱免费视频| 亚洲AV乱码久久精品蜜桃| 免费看黄的成人APP| 亚洲国产综合专区在线电影|