<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        OpenAI新研究:o1增加推理時間就能防攻擊,網友:DeepSeek也受益

        AIGC動態8個月前發布 量子位
        298 0 0

        新Scaling Law含金量又增加了

        OpenAI新研究:o1增加推理時間就能防攻擊,網友:DeepSeek也受益

        原標題:OpenAI新研究:o1增加推理時間就能防攻擊,網友:DeepSeek也受益
        文章來源:量子位
        內容字數:3052字

        OpenAI新研究:延長推理時間提升大模型對抗攻擊穩健性

        OpenAI 最新研究表明,增加大型語言模型(LLM)的推理時間計算量,可以顯著提高其對抗攻擊的穩健性,無需進行對抗性訓練。這項研究由OpenAI團隊完成,共同一作包括聯創之一Wojciech Zaremba和Boaz Barak。研究結果表明,即使面對多種類型的攻擊,增加計算量也能有效提升模型的防御能力,這對于日益增長的賦予Agent能力的LLM至關重要,特別是即將發布的OpenAI官方Agent“Operator”。

        研究背景及意義

        1. 對抗攻擊風險增加:隨著LLM被賦予Agent能力并執行現實世界任務,其面臨的對抗攻擊風險也日益增高。

        2. 對抗性訓練的局限性:目前主流的對抗性訓練方法存在依賴先驗知識、需要了解對手攻擊方式以及需要在穩健性和模型能力之間權衡等缺點。

        3. 新研究的突破:OpenAI的研究證明,通過增加推理計算時間,無需對抗性訓練,就能顯著提升模型的對抗穩健性,并在多個任務上得到了驗證。

        研究方法及結果

        1. 多種攻擊方式:研究團隊考察了幾種針對推理模型的攻擊方式,包括Many-shot攻擊、Soft token攻擊、Think less攻擊、Nerd-sniping攻擊、人類/AI紅隊攻擊以及多模態輸入對抗攻擊。

        2. 實驗結果:在大多數實驗中,隨著推理時間計算量的增加,模型抵御攻擊的成功率均有所提高。例如,在數學問題和智能體網頁瀏覽任務中,增加推理計算量后,攻擊成功率最終趨于0。

        3. 新穎攻擊分析:研究對Think less攻擊和Nerd-sniping攻擊進行了額外分析,發現模型在某些情況下會陷入無效的思考循環,從而更容易受到攻擊。

        研究局限性

        1. 有限的任務和計算范圍:研究僅涉及有限的任務和計算縮放范圍。

        2. 策略模糊性和漏洞:增加計算量可能無法有效防御利用策略模糊性或漏洞的攻擊。

        3. 推理計算的兩面性:Think less和Nerd sniping攻擊揭示了推理時間計算的兩面性,攻擊者可以誘導模型想太多或想太少。

        潛在應用及未來展望

        這項研究結果對于提升LLM的安全性具有重要意義,也為其他類似模型的防御策略提供了新的思路。研究者也表示,這項研究并未完全解決對抗穩健性問題,但對未來方向感到興奮。 例如,DeepSeek-R1系列模型也可能從中受益。


        聯系作者

        文章來源:量子位
        作者微信:
        作者簡介:追蹤人工智能新趨勢,關注科技行業新突破

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 亚洲人成77777在线播放网站| 国产成人精品久久亚洲高清不卡 国产成人精品久久亚洲 | 在线精品自拍亚洲第一区| 十八禁的黄污污免费网站| 免费黄网站在线看| 成人永久免费福利视频网站| 性做久久久久免费观看| 在线观看亚洲AV每日更新无码| 一级毛片免费观看不收费| **一级一级毛片免费观看| 亚洲精品视频免费| 亚洲午夜电影一区二区三区| 一级黄色免费大片| 色噜噜AV亚洲色一区二区| 亚洲国产精品ⅴa在线观看| a级午夜毛片免费一区二区| 免费观看的a级毛片的网站| 精品久久久久久亚洲| 亚洲AV永久无码区成人网站| 亚洲一区AV无码少妇电影| 四虎免费在线观看| 亚洲精品美女久久久久9999| 一级做a爰片久久免费| 亚洲人成精品久久久久| 在线永久免费的视频草莓| 亚洲色大成网站WWW久久九九 | 91亚洲性爱在线视频| 国产福利免费观看| 亚洲一区二区三区四区视频| 暖暖在线视频免费视频| 亚洲日韩国产成网在线观看| 精品在线免费观看| 男人天堂2018亚洲男人天堂| 18禁无遮挡无码国产免费网站| 亚洲欧美中文日韩视频| 成年女人毛片免费播放视频m | 国产亚洲漂亮白嫩美女在线| 亚洲精品乱码久久久久久蜜桃不卡 | 欧美色欧美亚洲另类二区| 成人午夜18免费看| 国产又黄又爽胸又大免费视频 |