AIGC動態歡迎閱讀
原標題:圖像偽造照妖鏡!北大發布多模態LLM圖像篡改檢測定位框架FakeShield
關鍵字:圖像,模型,區域,數據,解釋性
文章來源:新智元
內容字數:0字
內容摘要:
新智元報道編輯:LRST
【新智元導讀】北京大學的研究人員開發了一種新型多模態框架FakeShield,能夠檢測圖像偽造、定位篡改區域,并提供基于像素和圖像語義錯誤的合理解釋,可以提高圖像偽造檢測的可解釋性和泛化能力。隨著生成式人工智能(AIGC)的迅猛發展,圖像編輯與合成技術變得愈加成熟與普及。這一趨勢為圖像內容創作帶來了便捷的同時,也顯著增加了篡改檢測的難度。
用戶能夠通過Photoshop、DeepFake、AIGC等工具對圖像進行高質量編輯,且往往不留任何痕跡。在此背景下,如何準確檢測并定位篡改區域,成為了學術界與工業界的關注重點。
盡管現有的圖像篡改檢測與定位(IFDL)算法在網絡結構和訓練策略上取得了一定進展,但仍存在幾個主要問題:
1. 大多數方法采用黑箱模型,僅輸出真實性概率,缺乏詳細的檢測解釋,導致用戶對結果的信任度降低。
2. 現有算法通常針對特定篡改技術,缺乏應對多樣化篡改手段的能力,降低了實用性。
為了解決這些問題,如圖1所示,北京大學與華南理工大學的研究團隊提出了一種全新的任務:可解釋的圖像偽造檢測與定位(e-IFDL),并設計了一個新穎的多模態偽造檢測定位
原文鏈接:圖像偽造照妖鏡!北大發布多模態LLM圖像篡改檢測定位框架FakeShield
聯系作者
文章來源:新智元
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...