谷歌發布Prompt Expansion框架，讓文生圖更輕松！

AIGC動態2年前 (2024)發布夕小瑤科技說

AIGC動態歡迎閱讀

原標題：谷歌發布Prompt Expansion框架，讓文生圖更輕松！
關鍵字：圖像,提示,模型,文本,多樣性
文章來源：夕小瑤科技說
內容字數：7370字

內容摘要：

夕小瑤科技說原創作者 | 付奶茶、Python盡管文本生成圖像（Text-to-Image Generation）模型功能強大，但有效地利用它們依然是一項挑戰，因為傳統使用方法往往需要用戶具備特定的技能和知識。為此，谷歌推出了一種名為提示擴展（Prompt Expansion）的創新框架，旨在幫助用戶更輕松地創造出既高質量又多樣化的圖像。讓我們一起了解這個框架的魅力吧！
論文標題:Prompt Expansion for Adaptive Text-to-Image Generation
論文鏈接:https://arxiv.org/pdf/2312.16720.pdf
問題陳述文本到圖像生成模型能夠根據文本提示創造相應圖像，但這通常需要精確和詳細的指引。然而，存在兩大挑戰：
提示工程復雜：用戶需精心設計提示以生成高質量圖像。這涉及使用專業術語（如“35mm”、“背光”等）和獨特描述（如“大膽創新”）。由于有效提示的不穩定性，用戶需不斷試驗，這限制了模型的易用性和創造力。
圖像多樣性不足：即便用戶提示未具體指定細節，生成的圖像往往缺乏變化。例如，“南瓜燈設計”的提示可能導致風格和視角

原文鏈接：谷歌發布Prompt Expansion框架，讓文生圖更輕松！