AIGC動態歡迎閱讀
原標題:一張照片,為深度學習巨頭們定制人像圖片
關鍵字:模型,保真度,文本,圖像,方法
文章來源:機器之心
內容字數:4811字
內容摘要:
機器之心專欄
作者:InstantX 團隊主題驅動的文本到圖像生成,通常需要在多張包含該主題(如人物、風格)的數據集上進行訓練,這類方法中的代表工作包括 DreamBooth、Textual Inversion、LoRAs 等,但這類方案因為需要更新整個網絡或較長時間的定制化訓練,往往無法很有效地兼容社區已有的模型,并無法在真實場景中快速且低成本應用。而目前基于單張圖片特征進行嵌入的方法(FaceStudio、PhotoMaker、IP-Adapter),要么需要對文生圖模型的全參數訓練或 PEFT 微調,影響原本模型的泛化性能,缺乏與社區預訓練模型的兼容性,要么無法保持高保真度。
為了解決這些問題,來自 InstantX 團隊的研究人員提出了 InstantID,該模型不訓練文生圖模型的 UNet 部分,僅訓練可插拔模塊,在推理過程中無需 test-time tuning,在幾乎不影響文本控制能力的情況下,實現高保真 ID 保持。論文標題:InstantID: Zero-shot Identity-Preserving Generation in Seconds
論文地址:https
原文鏈接:一張照片,為深度學習巨頭們定制人像圖片
聯系作者
文章來源:機器之心
作者微信:almosthuman2014
作者簡介:專業的人工智能媒體和產業服務平臺
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...