AIGC動態歡迎閱讀
原標題:Diffusion 反饋強勢助力 CLIP 秒變火眼金睛:北京智源研究院、中科院自動化所聯合推出 DIVA
關鍵字:模型,視覺,能力,圖像,文本
文章來源:AI科技評論
內容字數:0字
內容摘要:
本文分享論文Diffusion Feedback Helps CLIP See Better,專注于通過自監督學習范式解決CLIP無法區分細粒度視覺細節的問題。
作者:王文軒(中科院自動化所-智源研究院聯培博一研究生),孫泉(智源研究院視覺模型研究中心算法研究員),張帆(智源研究院視覺模型研究中心算法研究員),唐業鵬(北交博一研究生),劉靜(中科院自動化所研究員),王鑫龍(智源研究院視覺模型研究中心負責人)
單位:中科院自動化所,中國科學院大學,北京智源人工智能研究院,北京交通大學
論文鏈接:https://arxiv.org/abs/2407.20171
項目主頁:https://rubics-xuan.github.io/DIVA/
相關代碼鏈接:https://github.com/baaivision/DIVA1動機何在?——CLIP視覺缺陷對比語言-圖像預訓練(CLIP)在跨領域和跨模態的開放世界表示方面表現出色,已成為各種視覺和多模態任務的基礎。
自從CLIP被提出以來,近年來涌現了許多關于CLIP模型的后續研究。這些研究通過預訓練和微調CLIP模型,取得了性能提升并開發了
原文鏈接:Diffusion 反饋強勢助力 CLIP 秒變火眼金睛:北京智源研究院、中科院自動化所聯合推出 DIVA
聯系作者
文章來源:AI科技評論
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...