AI圖像鑒別新SOTA
原標題:小紅書等給AI圖像檢測上難度!數據集均通過人類感知“圖靈測試” | ICLR 2025
文章來源:量子位
內容字數:8370字
小紅書團隊聯合高校推出AI生成圖像檢測新方法:AIDE
隨著AI生成內容的普及,精準甄別AI生成圖像成為迫切需求。小紅書生態算法團隊、中科大、上海交通大合推出了一套行業領先的AI生成圖像檢測方法——AIDE,并構建了高質量的Chameleon基準數據集,顯著提升了AI生成圖像檢測的準確率。
1. 現有AI生成圖像檢測方法的局限性
現有的AI生成圖像檢測方法通常存在兩個主要問題:評估基準過于簡單,現有基準數據集中的圖像通常包含一些人工痕跡(artifacts);訓練數據的局限性,模型通常在一個特定的生成模型(如GAN或擴散模型)上進行訓練,限制了其泛化能力。
2. Chameleon數據集:更真實,更具挑戰性
為了解決上述問題,研究團隊構建了Chameleon數據集,該數據集具有以下顯著特點:
- 高度逼真性:所有AI生成圖像均通過了人類感知“圖靈測試”,人類標注者難以將其與真實圖像區分。
- 多樣化類別:涵蓋人類、動物、物體和場景等多類圖像,模擬現實世界場景。
- 高分辨率:圖像分辨率普遍超過720P,最高可達4K,提供更豐富的細節信息。
Chameleon數據集的構建過程非常嚴謹,包括多渠道高逼真度圖像獲取、多維度精細化數據清洗(分辨率過濾、內容過濾、去重處理、文本-圖像一致性過濾)以及專業標注平臺與多輪評估。
與之前的基準數據集相比,Chameleon數據集在規模、多樣性和圖像質量方面均展現出顯著優勢,包含約26,000張測試圖像,是目前最大的AI生成圖像檢測數據集之一。
3. AIDE模型:多專家融合的檢測框架
AIDE模型(AI-generated Image DEtector with Hybrid Features)通過融合多種專家模塊,從低級像素統計和高級語義兩個層面全面捕捉圖像特征,實現了對AI生成圖像的精準檢測。
AIDE模型主要由兩個核心模塊組成:
- Patchwise Feature Extraction (PFE) 模塊:捕捉圖像中的低級像素統計特征,例如噪聲模式和紋理異常。
- Semantic Feature Embedding (SFE) 模塊:捕捉圖像中的高級語義特征,例如物體共現和上下文關系。
這兩個模塊提取的特征融合后,通過多層感知機(MLP)進行最終的分類預測。
4. 實驗結果與結論
實驗結果表明,AIDE模型在AIGCDetectBenchmark和GenImage數據集上取得了顯著的性能提升,分別比現有的最先進方法提高了3.5%和4.6%的準確率。即使在更具挑戰性的Chameleon數據集上,AIDE也取得了最佳性能,但這表明AI生成圖像檢測仍然具有很大的挑戰性,需要進一步的研究和改進。
5. 未來工作
研究團隊計劃在未來工作中進一步優化模型架構,探索更高效的特征提取和融合方法,并擴大Chameleon數據集的規模,以推動AI生成圖像檢測技術的進一步發展。
聯系作者
文章來源:量子位
作者微信:
作者簡介:追蹤人工智能新趨勢,關注科技行業新突破