建議收藏!Google+即夢+豆包三大官方AI繪圖提示詞手冊,終于有人整理全了!

導讀:厭倦了復制粘貼的AI繪圖提示詞?本文將深入解析Google Gemini 2.5 Flash Image的官方教程,揭示“描述場景”而非“羅列關鍵詞”的核心原則。通過11個實用案例和進階技巧,教你如何與AI進行更有效的“對話”,創作出更具靈魂的圖像作品。無論是從文本生成圖像,還是編輯帶文字的圖片,都能讓你擺脫“自嗨”,真正掌握AI繪圖的“道”與“術”。
大家好,我是閃閃!這是我的第 3 篇原創。最近在AI繪圖的社群里,我發現許多朋友都面臨著一個共同的難題:只會套用現成的提示詞,難以原創,每次都只是簡單修改幾個字。對此,我深入研究了Google官方發布的Gemini 2.5 Flash Image(即近期備受矚目的nano banana)圖像生成教程,原文地址為:《How to prompt Gemini 2.5 Flash Image Generation for the best results》。這份教程不僅揭示了AI繪圖的精髓,還提供了11個極具價值的實用案例,涵蓋了從文本生成圖像的6個場景,以及編輯帶文字圖片功能的4個應用,并附帶一套最佳實踐。這篇文章將帶你徹底告別“關鍵詞堆砌”,學會如何用更具創意和情感的方式與AI溝通。
扎心:你可能一直在“自嗨”
捫心自問,你平時寫提示詞是不是這樣的?“美女,長發,白裙子,桂花,背景虛化,8K,專業攝影”。如果你的答案是肯定的,那么你很可能已經陷入了第一個誤區:將AI視為一個簡單的“關鍵詞搜索引擎”。
那么,正確的寫法應該是什么樣的呢?同樣是想描繪一個女孩在櫻花樹下的場景,不妨試試這樣表達:
“春日午后,一位身著素雅白裙的秀麗長發女子,靜靜佇立于爛漫盛開的櫻花樹下。微風輕拂,幾縷粉色的花瓣悄然飄落,點綴在她肩頭。她凝望著遠方,眼中流露出一絲淡淡的思念,仿佛在靜候一位重要之人。身后的櫻花林在柔和的光影下,呈現出自然的虛化效果,整個畫面彌漫著“青春里美好而略帶傷感”的獨特氛圍,宛如電影場景般細膩而富有層次。”
感受到了其中的區別嗎?前者只是簡單地“羅列關鍵詞”,而后者則是在“描繪一個生動的場景”。
Google官方教程揭秘:為何要“描述場景”而非“羅列關鍵詞”?
Google的教程明確指出,AI需要的是“情境理解”,而非簡單的“元素拼湊”。
原因一:AI需要“情境理解”,而非“元素拼湊”
錯誤思路是直接告訴AI圖片應該包含哪些元素,例如“悲傷的人,公園,長椅,雨天”。而正確的思路是讓AI理解你想要表達的情境和感覺,例如“那種下雨天一個人坐在長椅上,想起某個重要的人已經不在身邊的情景”。前者是“羅列元素”,后者則是在“描述情境”,AI能夠從中自動推導出所需的全部元素,并以更自然的方式進行組合。
原因二:“故事化描述”比“清單式羅列”效果更佳
我們習慣于列出清單式的描述,例如:“?人物:年輕女性 ?服裝:藍色牛仔褲 ?場景:咖啡廳 ?光線:溫暖 ?風格:日系”。然而,Google建議采用故事化的描述方式,例如:“一個剛剛收到好消息的女孩,坐在最喜歡的咖啡廳里,那種忍不住想要分享喜悅但又想獨自品味這份幸福的復雜心情”。這種故事化的描述讓AI理解了“為什么”,而不僅僅是“是什么”,從而生成更有“靈魂”的圖片。
原因三:善用AI的“聯想能力”,而非“執行能力”
nano banana最強大的地方在于它能夠“理解抽象概念”并將其轉化為具體畫面。因此,你可以嘗試描述一種感覺,例如:“就像宮崎駿動畫里那種淡淡的憂傷感”;引用經典場景,如:“像《她》這部電影的色調和氛圍”;或者使用比喻,比如:“有種 iPhone 人像模式的那種背景虛化效果”。這些描述比直接說“景深、虛化、暖色調”要有效得多。
實戰模板:從“翻車”到“出片”
理論講了這么多,現在讓我們轉向實用的部分。我將Google官方教程中的案例按照應用場景進行了分類,并為每個案例提供了詳細的提示詞結構。這些模板可以直接套用,建議您將本文收藏,以便隨時查閱。無論您是從事產品設計、內容創作,還是純粹想體驗AI繪圖的樂趣,這些模板都能助您快速上手。
從文本創建圖像(6個核心場景)
1. 攝影級真實場景(Photorealistic scenes)
此類場景適用于需要高度真實感的圖像,例如產品宣傳、人物肖像等。關鍵在于像攝影師一樣思考,詳細描述相機角度、鏡頭類型、光照以及精細的細節。
模板結構:A photorealistic [鏡頭類型] of [主體], [動作或表情], set in [環境]. The scene is illuminated by [光線描述], creating a [氛圍] atmosphere. Captured with a [相機/鏡頭細節], emphasizing [關鍵紋理和細節]. The image should be in a [畫幅比例] format.
Google原文案例:A photorealistic close-up portrait of an elderly Japanese ceramicist with deep, sun-etched wrinkles and a warm, knowing smile. He is carefully inspecting a freshly glazed tea bowl. The setting is his rustic, sun-drenched workshop. The scene is illuminated by soft, golden hour light streaming through a window, highlighting the fine texture of the clay. Captured with an 85mm portrait lens, resulting in a soft, blurred background (bokeh). The overall mood is serene and masterful. Vertical portrait orientation.

2. 風格化插圖和貼紙(Stylized illustrations & stickers)
這類場景適用于創意表達、兒童讀物、品牌IP等。需要明確指定風格類型,如果需要白色背景,務必特別說明。
模板結構:A [風格] sticker of a [主體], featuring [關鍵特征] and a [色彩搭配]. The design should have [線條風格] and [陰影風格]. The background must be white.
Google原文案例:A kawaii-style sticker of a happy red panda wearing a tiny bamboo hat. It’s munching on a green bamboo leaf. The design features bold, clean outlines, simple cel-shading, and a vibrant color palette. The background must be white.

3. 圖片中的準確文字(Accurate text in images)
Gemini 2.5 Flash Image能夠直接在圖片中渲染文字。此時,您需要明確具體的文字內容、字體風格以及整體設計。
模板結構:Create a [圖像類型] for [品牌/概念] with the text “[要渲染的文字]” in a [字體風格]. The design should be [風格描述], with a [色彩方案].
Google原文案例:Create a modern, minimalist logo for a coffee shop called ‘The Daily Grind’. The text should be in a clean, bold, sans-serif font. The design should feature a simple, stylized icon of a coffee bean seamlessly integrated with the text. The color scheme is black and white.

4. 產品樣機與商業攝影(Product mockups & commercial photography)
此類場景適用于電商產品圖、包裝設計、產品原型展示等。重點在于描述專業的燈光設置和拍攝角度。
模板結構:A high-resolution, studio-lit product photograph of a [產品描述] on a [背景表面/描述]. The lighting is a [燈光設置] to [燈光目的]. The camera angle is a [角度類型] to showcase [特定功能]. Ultra-realistic, with sharp focus on [關鍵細節]. [畫幅比例].
Google原文案例:A high-resolution, studio-lit product photograph of a minimalist ceramic coffee mug in matte black, presented on a polished concrete surface. The lighting is a three-point softbox setup designed to create soft, diffused highlights and eliminate harsh shadows. The camera angle is a slightly elevated 45-degree shot to showcase its clean lines. Ultra-realistic, with sharp focus on the steam rising from the coffee. Square image.

5. 極簡主義與負空間設計(Minimalist & negative space design)
這類設計適用于創建網站背景、演示文稿或營銷材料,尤其適合需要疊加文字的場景。
模板結構:A minimalist composition featuring a single [主體] positioned in the [位置] of the frame. The background is a vast, empty [顏色] canvas, creating significant negative space. Soft, subtle lighting. [畫幅比例].
Google原文案例:A minimalist composition featuring a single, delicate red maple leaf positioned in the bottom-right of the frame. The background is a vast, empty off-white canvas, creating significant negative space for text. Soft, diffused lighting from the top left. Square image.

6. 連環畫(Comic panel / storyboard)
這類場景適合創建引人入勝的視覺敘事,可用于開發故事板、漫畫條或任何形式的連環畫。
模板結構:A single comic book panel in a [藝術風格] style. In the foreground, [角色描述和動作]. In the background, [場景細節]. The panel has a [對話/標題框] with the text “[文字]”. The lighting creates a [氛圍] mood. [畫幅比例].
Google原文案例:A single comic book panel in a gritty, noir art style with high-contrast black and white inks. In the foreground, a detective in a trench coat stands under a flickering streetlamp, rain soaking his shoulders. In the background, the neon sign of a desolate bar reflects in a puddle. A caption box at the top reads “The city was a tough place to keep secrets.” The lighting is harsh, creating a dramatic, somber mood. Landscape.

編輯帶文字的圖片(4個核心功能)
這是Gemini 2.5 Flash Image多模態能力真正發揮優勢的地方。您可以提供一張或多張圖像,并結合文字提示進行編輯、合成和風格遷移。
1. 圖像編輯:添加和移除元素(Image editing: Adding & removing elements)
提供一張圖像,然后簡單描述您想要進行的修改。模型會分析原始圖像的風格、光照和透視,確保編輯效果自然,并保持角色的一致性。
模板結構:Using the provided image of [主體], please [add/remove/modify] [元素] to/from the scene. Ensure the change is [變化如何融合的描述].
Google原文案例:Using the provided image of my cat, please add a small, knitted wizard hat on its head. Make it look like it’s sitting comfortably and matches the soft lighting of the photo.

2. 局部編輯(Inpainting: editing a specific area)
您可以與Gemini 2.5 Flash Image進行對話式交互,指示其僅編輯圖像的特定部分,而保持其余部分完全不變。
模板結構:Using the provided image, change only the [特定元素] to [新元素/描述]. Keep everything else in the image exactly the same, preserving the original style, lighting, and composition.
Google原文案例:Using the provided image of a living room, change only the blue sofa to be a vintage, brown leather chesterfield sofa. Keep the rest of the room, including the pillows on the sofa and the lighting, unchanged.

3. 風格遷移(Style transfer)
提供一張照片,要求模型以特定的風格或藝術流派重新創作其內容。
模板結構:Transform the provided photograph of [主體] into the artistic style of [藝術家/藝術風格]. Preserve the original composition but render it with [風格元素描述].
Google原文案例:Transform the provided photograph of a modern city street at night into the artistic style of Vincent van Gogh’s ‘Starry Night’. Preserve the original composition of buildings and cars, but render all elements with swirling, impasto brushstrokes and a dramatic palette of deep blues and bright yellows.

4. 高級合成:多圖像組合(Advanced composition: Combining multiple images)
提供多張圖像作為上下文,以創建全新的合成場景。這對于產品樣機或創意拼貼尤為適用。
模板結構:Create a new image by combining the elements from the provided images. Take the [圖像1中的元素] and place it with/on the [圖像2中的元素]. The final image should be a [最終場景描述].
Google原文案例:Create a professional e-commerce fashion photo. Take the blue floral dress from the first image and let the woman from the second image wear it. Generate a realistic, full-body shot of the woman wearing the dress, with the lighting and shadows adjusted to match an outdoor environment.

每個類別的核心技巧總結
通過以上模板,您是否發現了一些規律?
從文本創建圖像的6個場景:
- 攝影級真實場景:聚焦于光線、材質、情感氛圍的細致描繪,如同攝影師般進行構思。
- 風格化插圖和貼紙:強調色彩搭配、線條風格以及整體感覺,別忘了指定背景色。
- 圖片中的準確文字:注重功能性、品牌調性與視覺層次,務必明確字體風格。
- 產品樣機與商業攝影:突出產品特性、使用場景及專業感,詳細描述燈光設置。
- 極簡主義與負空間設計:創造留白空間,特別適合需要疊加文字的背景設計。
- 連環畫:側重敘事性、角色動作和場景氛圍,非常適合故事板創作。
編輯帶文字的圖片的4個功能:
- 添加和移除元素:保持原圖風格,使新元素自然融入。
- 局部編輯:精確修改特定區域,同時保持其他部分不變。
- 風格遷移:保留構圖,改變藝術風格。
- 多圖像組合:進行創意合成,適用于產品樣機和拼貼。
每種類型的提示詞都有其獨特的“語言”,掌握了這些,您就能與AI進行更精準、更有效的“對話”。
最佳實踐:Google官方建議
在實際應用中,Google還提供了一些核心建議,以助您進一步提升AI繪圖效果:
- 超級具體化描述:不要只說“幻想盔甲”,而要描繪“精美的精靈板甲,銀葉圖案蝕刻,高領設計,肩甲形似獵鷹翅膀”。細節越豐富,控制力越強。
- 提供背景和意圖:說明圖像的用途。例如,“為高端極簡護膚品牌創建logo”比單純說“創建logo”效果更佳。
- 迭代優化思維:不要期望一次就完美。利用對話的優勢進行小幅調整,例如“很棒,但能讓光線更溫暖一些嗎?”或“保持其他不變,讓角色表情更嚴肅一點”。
- 使用“語義負面提示”:避免直接說“沒有汽車”,而是積極描述“空曠荒涼的街道,沒有任何交通跡象”。
- 控制鏡頭語言:運用攝影和電影術語來控制構圖,如“廣角鏡頭”、“微距拍攝”、“低角度視角”、“85mm人像鏡頭”、“荷蘭角度”等,以精確控制最終圖像。
- 保持角色一致性:如果在多次編輯后發現角色特征開始偏移,可以重新開始對話,并提供詳細描述來維持一致性。
- 縱橫比控制:在編輯時,Gemini通常會保持輸入圖像的縱橫比。如果需要特定比例,請在提示中明確說明,例如:“更新輸入圖像……不要改變輸入的縱橫比”。
進階技巧:讓AI“讀懂”你的審美
除了基礎的提示詞技巧,還有幾個進階玩法可以幫助您更好地表達自己的審美:
- 建立“風格詞典”:與其每次都重新描述風格,不如建立自己的“風格詞典”。例如:
- “電影感”= 構圖有張力,光影對比強烈,有故事性
- “日系清新”= 色調偏暖,構圖簡潔,有生活氣息
- “賽博朋克”= 霓虹色彩,未來感建筑,科技與人文的對比
- 用“參考系”而非“技術詞”:與其說“景深效果,虛化背景”,不如說“像 iPhone 人像模式那種背景虛化”。與其說“電影級調色”,不如說“像《她》這部電影的色調”。
- 善用“對比”和“沖突”:AI特別擅長處理具有張力的畫面,例如:
- “現代都市里的古典美人”
- “廢墟中盛開的花朵”
- “科技感十足的咖啡廳里,一個人在手寫信件”
國產AI繪圖工具的提示詞指南
除了Google的nano banana,字節跳動的即夢和豆包也相繼推出了各自的提示詞使用指南。這兩家公司還發布了相關的操作手冊:
- 《即夢圖片 4.0 模型 提示詞手冊》:原文地址:https://bytedance.larkoffice.com/docx/L4vCdah1DoDg7axVdYGcoplSn9f
- 《豆包 Seedream 4.0 使用指南》:原文地址:https://bytedance.larkoffice.com/docx/XwngdqdhIowfF8xhEA4cwpS2nLb
寫在最后:AI繪圖的“道”與“術”
說了這么多技巧,但我覺得最重要的還是要理解AI繪圖的本質:把它當成創作伙伴,別當成執行工具。就像我們和朋友時,你不會說“請你理解我現在的心情是悲傷,程度為7分,持續時間3小時”,而是會說“唉,今天有點不開心,想找個人聊聊”。和AI對話也是一樣,與其給它一堆“技術指標”,不如和它分享你想要表達的“感覺”。