核心觀點:
Nano Banana 模型已在多個平臺上線,提供強大的圖像生成和編輯功能,尤其在多元素合成、局部修改、風格轉換、概念圖生成等方面展現出“邪修”般的創意玩法。雖然在尺寸控制和成功率上仍有待提升,但其強大的世界知識和靈活的操作方式,使其成為AI藝術創作的有力工具。
Nano Banana 模型現已全面上線,為AI藝術創作領域注入了新的活力。這款模型不僅登陸了AI Studio、Gemini、Whisk、Opal、OpenRouter等主流平臺,還在flowith上支持批量生成,徹底告別了在lmarena上“抽卡”的漫長等待。本文將深入探討Nano Banana的13種“邪修”玩法,并附上相應的提示語和效果展示,幫助用戶充分釋放其創意潛能。
多元素融合,打破上傳限制
Nano Banana 的一大亮點在于其強大的多元素合成能力。盡管Gemini單次上傳限制為10張圖片(除去背景,理論上最多指定9個元素),但通過將所有內容整合到一張圖片中并添加標簽,再在提示詞中引用這些標簽,便可突破上傳數量的限制。這種方法不僅能融合更多元素,還能顯著提升人臉光影和顏色的整體一致性。
例如,在“香蕉藝術品”場景中,通過為Mona、Pearl、David、Van Gogh、Leonardo等人物和場景元素添加標簽,可以實現復雜的組合生成。即使不使用文字標注,模型也能識別并整合圖像中的元素。

局部修改與“紅框”魔法
Nano Banana 在修改圖像局部細節方面表現出色,包括背景、畫風、人物配件、發型、服裝乃至人臉。而“紅框”功能更是將局部修改推向了極致。通過框選圖片中的特定元素,可以實現提取、放大、替換,甚至將元素“摳”出來。
例如,將框選出的人物放大并生成高清單人照片。
“紅框”還能精確限定物體替換的區域,有效避免模型在處理不同尺寸圖片時對插入物體大小的誤解。

將“紅框”區域完全涂抹并轉化為大面積紅色蒙版,則可以實現“無中生有”的創意生成。
“紅框”操作同樣可以在PPT等工具中完成,而蒙版制作則更為簡便,甚至可以使用手機自帶的圖片編輯功能。
利用模型世界知識,實現概念可視化
Nano Banana 擁有與Gemini媲美的世界知識儲備,能夠理解并生成基于現實世界信息的圖像。例如,可以將照片轉換為俯視視角,并標注攝影師的位置。
在此基礎上,還可以利用VEo3生成視頻空鏡素材。

上傳現實世界的建筑圖片并進行標注,可以實現基于位置的AR體驗生成。突出顯示興趣點并添加相關信息注釋。
火柴人動作漫畫與插畫真人化
通過在圖片上繪制紅線,模擬火柴人的動作,Nano Banana可以生成大幅度的動作漫畫。將不同的角色和動作結合,并添加場景交互,可以創作出動態十足的畫面。
此外,Nano Banana還能將插畫轉化為真人照片,并根據場景需求進行調整,例如將插畫女孩轉化為在Comic Market現場的Cosplay照片。
原創角色設計與概念圖生成
對于想要創造原創角色的用戶,Nano Banana 提供了全面的支持,可以生成角色設定、比例設定、三視圖、表情設定、動作設定以及服裝設定等。
此外,Nano Banana 還能生成概念解釋圖,將抽象概念可視化。例如,解釋GPT5是什么,或AI coding與人工coding的區別。
文字保持能力與未來展望
在海報生成方面,Nano Banana 展現了不錯的文字保持能力。例如,將現有海報中的產品和廣告語替換為iPhone相關內容,并將人物和配色調整為粉色。
然而,Nano Banana 目前在理解圖片尺寸限定方面尚不完美,例如對16:9、1:1、4:3等比例的識別能力有待提高。此外,作者提到在Gemini和AI Studio上線后,成功率反而不如Lmarena,平均需要多次嘗試才能獲得滿意結果。
盡管如此,Nano Banana 的強大功能和無限創意潛力使其成為繼GPT4o之后,備受矚目的AI模型。其豐富的“邪修”玩法,為藝術家和創作者提供了前所未有的創作度。
使用鏈接:
- https://gemini.google.com/app
- https://labs.google/fx/tools/whisk/project
- https://opal.withgoogle.com/?mode=canvas
- https://openrouter.ai/chat?models=google/gemini-2.5-flash-image-preview:free
- https://aistudio.google.com/app/prompts/new_chat?model=gemini-2.5-flash-image-preview