ControlNet作者搞起大模型：讓天下沒有難寫的生圖提示詞，一句話變構圖小作文

AIGC動態2年前 (2024)發布量子位

AIGC動態歡迎閱讀

原標題：ControlNet作者搞起大模型：讓天下沒有難寫的生圖提示詞，一句話變構圖小作文
關鍵字：提示,圖像,位置,元素,注意力
文章來源：量子位
內容字數：0字

內容摘要：

夢晨西風發自凹非寺量子位 | 公眾號 QbitAIControlNet作者新項目，居然也搞起大模型和Agent了。
當然還是和AI繪畫相關：解決大伙不會寫提示詞的痛點。
現在只需一句超簡單的提示詞說明意圖，Agent就會自己開始“構圖”：
a funny cartoon batman fights joker（一幅有趣的卡通蝙蝠俠與小丑戰斗的圖畫）
這就是ControlNet作者Lvmin Zhang的新玩具Omost。Omost這個名字有雙層含義：
發音與英文單詞almost（幾乎）相似，意味著每次使用Omost后，用戶所需的圖像幾乎就完成了；
“O”代表“omni”（全能的），“most”表示希望最大限度地利用它。
這個新項目讓網友直呼：也太強了！
放大翻譯成中文來看，用戶簡短的提示詞會被拆解擴展，從圖像全局描述到局部每個元素的都會詳細說明，直觀地指定圖像中各個元素的位置和大小。
之后，特定圖像生成器根據LLM描繪的“藍圖”創建最終的圖像。
而且，已經完成的圖像整體布局可以保留，想修改畫面中的某個元素，也只需一句提示詞。
原版是這樣嬸兒的：
generate an image

原文鏈接：ControlNet作者搞起大模型：讓天下沒有難寫的生圖提示詞，一句話變構圖小作文