<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        “AI黑箱:上海實驗室揭示大模型‘指紋’與剪枝合并的秘密!”

        AIGC動態5個月前發布 量子位
        314 0 0

        利用模型微調后表征不變性打造

        “破解AI黑箱:上海實驗室揭示大模型‘指紋’與剪枝合并的秘密!”

        原標題:專治大模型“套殼”!上海AI實驗室等給LLM做“指紋識別”,模型剪枝、合并等也無所遁形
        文章來源:量子位
        內容字數:5065字

        量子位投稿摘要:REEF方法有效檢測大模型“套殼”行為

        近日,來自上海AI Lab邵婧課題組的學者們提出了一種名為REEF(Representation Encoding Fingerprints)的方法,旨在有效檢測大語言模型(LLM)的未經授權的后續開發行為,通常被稱為“套殼”行為。該方法在不影響模型性能的情況下,通過表征編碼實現對源模型的精準識別,為大模型開發團隊應對侵權問題提供了新的解決方案。

        1. REEF的關鍵思想

        REEF依賴于模型在微調后的表征“不變性”,通過計算源模型與被測模型的CKA(中心核對齊)相似性來判斷二者的關系。CKA是一種用于測量兩組隨機變量之間性的相似性指數,能夠確保在不同的排列和縮放變換下保持魯棒性。這一特點使得REEF能夠有效識別經過剪枝、合并等處理后的衍生模型。

        2. 實驗驗證與魯棒性

        研究者將REEF應用于多種通過微調、剪枝、合并等手段衍生出的模型,結果顯示REEF在這些情況下依然能夠準確識別源模型,驗證了其優越的魯棒性。具體而言,REEF在使用多達700B tokens進行微調時仍能保持高達0.9962的相似度,對高達90%的剪枝比率也表現出良好的識別準確性。

        3. 跨數據集的有效性

        REEF的有效性還體現在其對不同數據集的適應性。實驗表明,REEF在多個數據集上均能穩定識別源模型,并且在樣本量較少時也能實現可靠的指紋識別。這使得REEF不僅在實際應用中具備高效性,也為模型的知識產權保護提供了有力支持。

        4. 結論與展望

        REEF方法為大模型的開發與知識產權管理提供了一種新標準,推動了更透明與合作的AI社區。作者們相信,這一研究成果將促進AI模型的保護與安全可信性的發展。

        相關論文鏈接:[REEF論文](https://arxiv.org/abs/2410.14273),項目主頁:[REEF項目](https://github.com/tmylla/REEF)。


        聯系作者

        文章來源:量子位
        作者微信:
        作者簡介:追蹤人工智能新趨勢,關注科技行業新突破

        閱讀原文
        ? 版權聲明
        Trae官網

        相關文章

        Trae官網

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 亚洲精品国产成人| 一区二区三区观看免费中文视频在线播放| 成年女人男人免费视频播放| 亚洲成色WWW久久网站| 黄页免费视频播放在线播放| 免费无码A片一区二三区| 亚洲熟妇AV日韩熟妇在线| 亚洲成A人片在线观看中文| 久久精品免费电影| 亚洲国产精品无码久久SM| 青青青免费国产在线视频小草| 无码天堂va亚洲va在线va| 国产精品酒店视频免费看| 亚洲另类无码一区二区三区| 亚洲精品无码av天堂| 日本zzzzwww大片免费| 曰批免费视频播放在线看片二| 亚洲精品网站在线观看你懂的| 亚洲国产a级视频| 四虎永久在线观看免费网站网址| 日韩a毛片免费观看| 亚洲毛片基地日韩毛片基地| 亚洲美女在线国产| 夭天干天天做天天免费看| 久久一本岛在免费线观看2020| 亚洲精华国产精华精华液好用 | 亚洲精品福利网泷泽萝拉| 免费成人午夜视频| 91精品免费观看| 国产成人1024精品免费| 亚洲一区二区三区丝袜| 亚洲自偷自偷精品| 中文字幕精品无码亚洲字 | 尤物永久免费AV无码网站| 美女啪啪网站又黄又免费| 亚洲国产精品综合久久网各| 亚洲欧洲∨国产一区二区三区| 国产精品公开免费视频| 99久久这里只精品国产免费| 亚洲AV无码AV男人的天堂不卡| 久久久亚洲欧洲日产国码是AV|