<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        “AI黑箱:上海實驗室揭示大模型‘指紋’與剪枝合并的秘密!”

        AIGC動態7個月前發布 量子位
        317 0 0

        利用模型微調后表征不變性打造

        “破解AI黑箱:上海實驗室揭示大模型‘指紋’與剪枝合并的秘密!”

        原標題:專治大模型“套殼”!上海AI實驗室等給LLM做“指紋識別”,模型剪枝、合并等也無所遁形
        文章來源:量子位
        內容字數:5065字

        量子位投稿摘要:REEF方法有效檢測大模型“套殼”行為

        近日,來自上海AI Lab邵婧課題組的學者們提出了一種名為REEF(Representation Encoding Fingerprints)的方法,旨在有效檢測大語言模型(LLM)的未經授權的后續開發行為,通常被稱為“套殼”行為。該方法在不影響模型性能的情況下,通過表征編碼實現對源模型的精準識別,為大模型開發團隊應對侵權問題提供了新的解決方案。

        1. REEF的關鍵思想

        REEF依賴于模型在微調后的表征“不變性”,通過計算源模型與被測模型的CKA(中心核對齊)相似性來判斷二者的關系。CKA是一種用于測量兩組隨機變量之間性的相似性指數,能夠確保在不同的排列和縮放變換下保持魯棒性。這一特點使得REEF能夠有效識別經過剪枝、合并等處理后的衍生模型。

        2. 實驗驗證與魯棒性

        研究者將REEF應用于多種通過微調、剪枝、合并等手段衍生出的模型,結果顯示REEF在這些情況下依然能夠準確識別源模型,驗證了其優越的魯棒性。具體而言,REEF在使用多達700B tokens進行微調時仍能保持高達0.9962的相似度,對高達90%的剪枝比率也表現出良好的識別準確性。

        3. 跨數據集的有效性

        REEF的有效性還體現在其對不同數據集的適應性。實驗表明,REEF在多個數據集上均能穩定識別源模型,并且在樣本量較少時也能實現可靠的指紋識別。這使得REEF不僅在實際應用中具備高效性,也為模型的知識產權保護提供了有力支持。

        4. 結論與展望

        REEF方法為大模型的開發與知識產權管理提供了一種新標準,推動了更透明與合作的AI社區。作者們相信,這一研究成果將促進AI模型的保護與安全可信性的發展。

        相關論文鏈接:[REEF論文](https://arxiv.org/abs/2410.14273),項目主頁:[REEF項目](https://github.com/tmylla/REEF)。


        聯系作者

        文章來源:量子位
        作者微信:
        作者簡介:追蹤人工智能新趨勢,關注科技行業新突破

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 亚洲精品第一国产综合野| 99亚洲男女激情在线观看| 99人中文字幕亚洲区 | 又黄又爽的视频免费看| 亚洲成a人片在线观看无码| 亚洲香蕉在线观看| 国国内清清草原免费视频99| 亚洲午夜久久久影院伊人| 亚洲国产乱码最新视频| a毛片免费播放全部完整| 日本人护士免费xxxx视频| 亚洲四虎永久在线播放| 添bbb免费观看高清视频| 久久精品免费大片国产大片| 国内免费高清在线观看| 亚洲国产精品久久久久网站 | 在线涩涩免费观看国产精品 | 成人免费视频观看无遮挡| 久久久久亚洲精品无码系列| 青青青视频免费观看| 国产亚洲?V无码?V男人的天堂| 亚洲AV成人精品一区二区三区| 日韩免费一区二区三区在线| 午夜在线a亚洲v天堂网2019| 全部免费国产潢色一级| 久久久久亚洲国产| 亚洲国产精品成人| 高潮毛片无遮挡高清免费视频| 中文字幕亚洲日本岛国片| 99爱在线观看免费完整版| 亚洲va无码va在线va天堂| 色吊丝性永久免费看码 | 97av免费视频| 麻豆亚洲AV永久无码精品久久 | 亚洲中文字幕无码av永久| 国产电影午夜成年免费视频| 亚洲卡一卡2卡三卡4卡无卡三| 国产三级在线观看免费| 国产成人1024精品免费| 国产亚洲精品拍拍拍拍拍| av免费不卡国产观看|