国产精品亚洲mnbav网站_成人午夜亚洲精品无码网站_日韩va亚洲va欧洲va国产_亚洲欧洲精品成人久久曰影片

揭秘多輪越獄攻擊新框架:RACE 如何利用大模型推理能力突破安全防線?

北航等單位提出RACE框架,攻擊成功率高達(dá)96%,OpenAI、DeepSeek等主流模型均被攻破。

揭秘多輪越獄攻擊新框架:RACE 如何利用大模型推理能力突破安全防線?

原標(biāo)題:揭秘多輪越獄攻擊新框架:RACE 如何利用大模型推理能力突破安全防線?
文章來(lái)源:AI科技評(píng)論
內(nèi)容字?jǐn)?shù):4940字

北航團(tuán)隊(duì)提出RACE框架:大模型越獄攻擊成功率高達(dá)96%

近日,北京航空航天大學(xué)等機(jī)構(gòu)的研究團(tuán)隊(duì)發(fā)表論文,提出了一種名為RACE(Reasoning-Augmented Conversation)的多輪越獄攻擊框架,該框架利用大模型的推理能力,成功攻破了包括OpenAI和DeepSeek在內(nèi)的多個(gè)主流大模型,攻擊成功率高達(dá)96%。本文一作為北航博士生應(yīng)宗浩,其團(tuán)隊(duì)近年來(lái)在大模型安全評(píng)測(cè)方面成果豐碩。

1. 大模型越獄攻擊的背景

大型語(yǔ)言模型(LLMs)強(qiáng)大的推理能力使其在各種任務(wù)中表現(xiàn)出色,但也為越獄攻擊提供了新的途徑。越獄攻擊旨在通過(guò)精心設(shè)計(jì)的提示,繞過(guò)模型的安全機(jī)制,誘導(dǎo)其生成不安全或有害的回復(fù)。多輪越獄攻擊比單擊更具威脅性,因?yàn)樗M了真實(shí)世界中的人類交互過(guò)程。

2. RACE框架的核心思想

RACE框架的核心在于將有害查詢轉(zhuǎn)化為看似良性的復(fù)雜推理任務(wù),利用大模型的推理能力逐步引導(dǎo)其生成有害內(nèi)容。該框架包含三個(gè)核心模塊:

  1. 攻擊狀態(tài)機(jī)(ASM):將攻擊過(guò)程系統(tǒng)化,確保多輪對(duì)話中的語(yǔ)義連貫性,避免觸發(fā)模型的安全機(jī)制。
  2. 增益引導(dǎo)探索(GE):通過(guò)計(jì)算信息增益,選擇最優(yōu)查詢,高效推進(jìn)攻擊目標(biāo)。
  3. 自我對(duì)弈(SP):在影子模型中模擬拒絕響應(yīng),提前優(yōu)化查詢結(jié)構(gòu),使其更難以被目標(biāo)模型檢測(cè)到。

此外,RACE還包含一個(gè)拒絕反饋(RF)模塊,用于快速恢復(fù)因模型安全機(jī)制觸發(fā)而失敗的攻擊。

3. 實(shí)驗(yàn)結(jié)果與分析

實(shí)驗(yàn)結(jié)果顯示,RACE在多個(gè)主流大模型上的攻擊成功率高達(dá)96%,尤其在OpenAI o1和DeepSeek R1等推理能力強(qiáng)的模型上表現(xiàn)突出。即使面對(duì)現(xiàn)有的防御機(jī)制,RACE也展現(xiàn)了強(qiáng)大的魯棒性。該研究表明,推理能力越強(qiáng)的大模型,越容易受到推理驅(qū)動(dòng)的攻擊。

4. 推理能力與安全風(fēng)險(xiǎn)的博弈

RACE的成功揭示了當(dāng)前大模型安全機(jī)制的脆弱性,也引發(fā)了對(duì)推理能力與安全風(fēng)險(xiǎn)之間關(guān)系的思考。高推理能力雖然提升了模型的性能,但也為攻擊者提供了新的突破口。如何在提升模型推理能力的同時(shí)保障其安全性,是未來(lái)大模型發(fā)展的重要課題。

5. 結(jié)論與未來(lái)方向

RACE框架的提出為大模型安全研究敲響了警鐘。研究團(tuán)隊(duì)強(qiáng)調(diào),其目標(biāo)是推動(dòng)大模型安全研究,提升對(duì)潛在風(fēng)險(xiǎn)的認(rèn)知。未來(lái),他們計(jì)劃進(jìn)一步優(yōu)化RACE的效率,開(kāi)發(fā)更強(qiáng)大的防御機(jī)制,并呼吁大模型開(kāi)發(fā)者加強(qiáng)對(duì)推理能力的監(jiān)控,開(kāi)發(fā)更魯棒的安全對(duì)齊技術(shù)。


聯(lián)系作者

文章來(lái)源:AI科技評(píng)論
作者微信:
作者簡(jiǎn)介:雷峰網(wǎng)旗下AI新媒體。聚焦AI前沿研究,關(guān)注AI工程落地。

閱讀原文
? 版權(quán)聲明
蟬鏡AI數(shù)字人

相關(guān)文章

蟬鏡AI數(shù)字人

暫無(wú)評(píng)論

暫無(wú)評(píng)論...
国产精品亚洲mnbav网站_成人午夜亚洲精品无码网站_日韩va亚洲va欧洲va国产_亚洲欧洲精品成人久久曰影片
<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        三级影片在线观看欧美日韩一区二区| 精品国产精品网麻豆系列| 91国偷自产一区二区三区观看| 国产亚洲自拍一区| 成人综合日日夜夜| 亚洲欧美综合另类在线卡通| 一本色道久久综合亚洲91 | 国产精品自拍在线| 亚洲国产精品成人综合色在线婷婷 | 在线成人免费视频| 狠狠色丁香婷综合久久| 中文字幕va一区二区三区| 91啦中文在线观看| 日韩精品欧美精品| 国产欧美精品一区二区色综合朱莉| 国产乱码精品一区二区三区av| 亚洲色图19p| 欧美精品一区二区久久婷婷| av午夜一区麻豆| 免费观看91视频大全| 捆绑紧缚一区二区三区视频| www成人在线观看| 国产成人综合在线观看| 亚洲欧美日韩国产手机在线 | 欧美一级二级三级蜜桃| 国产精品12区| 亚洲成在人线免费| 国产人久久人人人人爽| 欧美一区二区三区免费观看视频| 国产精品正在播放| 天堂一区二区在线免费观看| 国产精品久线观看视频| 精品电影一区二区三区| 欧美视频日韩视频在线观看| 成人黄色a**站在线观看| 免费成人性网站| 一区二区欧美在线观看| 国产精品色一区二区三区| 精品久久久久久亚洲综合网| 欧美日韩中文另类| 色拍拍在线精品视频8848| 国产精品亚洲第一| 国产精品1024| 国产酒店精品激情| 久久精品二区亚洲w码| 亚洲免费高清视频在线| 中文字幕日韩一区二区| 中文字幕亚洲在| 国产精品久久夜| 国产精品久久久久久妇女6080| 久久精品夜夜夜夜久久| 国产偷国产偷亚洲高清人白洁| 精品少妇一区二区三区| 精品久久国产97色综合| 精品国产乱子伦一区| 日韩欧美aaaaaa| 精品国产伦一区二区三区观看体验 | 国产精品1024久久| 国产原创一区二区三区| 国产一区二区三区久久久| 久久国产乱子精品免费女| 奇米一区二区三区av| 免费在线视频一区| 久久疯狂做爰流白浆xx| 国产精品中文字幕日韩精品| 成人午夜电影网站| 在线免费观看日韩欧美| 欧美日韩精品电影| 精品福利一区二区三区| 国产亚洲一本大道中文在线| 国产拍揄自揄精品视频麻豆| 中文字幕日韩一区二区| 亚洲国产一区视频| 美女视频黄 久久| 成人午夜电影久久影院| 欧美日韩视频专区在线播放| 91精品免费在线观看| 久久久美女毛片| 一区二区三区色| 青青草国产成人99久久| 国产大陆精品国产| 日本伦理一区二区| 日韩一区二区三区视频在线| 欧美韩日一区二区三区四区| 一区二区三区蜜桃网| 青草国产精品久久久久久| 国产九色sp调教91| 欧美视频一区二区三区四区| 日韩免费成人网| 专区另类欧美日韩| 黄页视频在线91| 色综合天天狠狠| 精品久久一区二区| 亚洲二区在线观看| 成人午夜短视频| 欧美一区二区美女| 亚洲精品中文字幕乱码三区| 日本伊人精品一区二区三区观看方式| 国产成人啪午夜精品网站男同| 欧美性高清videossexo| 国产日产欧产精品推荐色| 婷婷六月综合亚洲| 粉嫩一区二区三区在线看| 国产成a人亚洲| 欧美丝袜自拍制服另类| 久久精品视频免费| 三级久久三级久久久| 国产精品白丝jk黑袜喷水| 欧美无砖砖区免费| 国产日韩欧美高清在线| 久久精品国产999大香线蕉| 欧美午夜视频网站| 国产精品久久久久桃色tv| 激情av综合网| 91麻豆精品国产91久久久久 | 天堂成人国产精品一区| 成人app网站| 久久久久国产精品免费免费搜索| 日日噜噜夜夜狠狠视频欧美人| 色吊一区二区三区| 亚洲欧美视频在线观看| 97久久超碰国产精品电影| 国产视频在线观看一区二区三区| 麻豆精品视频在线观看| 欧美久久久久久久久中文字幕| 亚洲黄色片在线观看| 不卡av免费在线观看| 国产精品美女视频| 丁香婷婷深情五月亚洲| 中文字幕欧美日韩一区| 成人国产精品免费观看| 国产精品卡一卡二卡三| 成人污视频在线观看| 国产欧美日本一区二区三区| 粉嫩嫩av羞羞动漫久久久| 国产欧美一区二区三区沐欲| 国产在线精品视频| 久久久久久久综合| 成人免费福利片| 1000精品久久久久久久久| 粉嫩欧美一区二区三区高清影视| 国产视频一区二区在线观看| 成人午夜在线视频| 亚洲欧美一区二区三区极速播放 | 日韩情涩欧美日韩视频| 久久av资源站| 中文av一区二区| 91美女福利视频| 亚洲国产成人精品视频| 日韩一区二区在线免费观看| 精东粉嫩av免费一区二区三区| 久久久综合精品| 99精品视频在线免费观看| 亚洲精品老司机| 欧美精品久久久久久久久老牛影院 | 91麻豆精品久久久久蜜臀| 精品一区二区免费看| 国产精品久久久久久妇女6080| 99精品视频一区| 日韩专区在线视频| 久久先锋影音av| 欧美制服丝袜第一页| 久久国产日韩欧美精品| 日韩一区在线播放| 7777精品伊人久久久大香线蕉超级流畅| 精品一区二区三区在线视频| 中文字幕制服丝袜成人av| 7777精品伊人久久久大香线蕉经典版下载 | 韩国一区二区在线观看| 亚洲视频狠狠干| 91精品国产综合久久蜜臀| 国产二区国产一区在线观看| 亚洲自拍欧美精品| 久久婷婷色综合| 777xxx欧美| 91在线云播放| 久久99精品一区二区三区三区| 国产精品久久久久久久岛一牛影视| 欧美日韩成人高清| 成人看片黄a免费看在线| 日韩和欧美一区二区三区| 亚洲欧洲精品一区二区精品久久久| 91精品久久久久久久久99蜜臂| 成人三级在线视频| 韩国精品久久久| 免费视频一区二区| 亚洲精品综合在线| 国产精品激情偷乱一区二区∴| 日韩欧美黄色影院| 欧美精品第一页| 在线精品视频一区二区| 国产91综合网| 国产一区亚洲一区| 蜜桃av一区二区在线观看| 亚洲国产精品一区二区久久| 国产精品国产馆在线真实露脸| 久久精品在线观看| 久久一区二区三区四区| 精品国产乱码久久久久久1区2区| 欧美一区二区精品在线|