ControlNet作者搞起大模型:讓天下沒有難寫的生圖提示詞,一句話變構(gòu)圖小作文
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:ControlNet作者搞起大模型:讓天下沒有難寫的生圖提示詞,一句話變構(gòu)圖小作文
關(guān)鍵字:提示,圖像,位置,元素,注意力
文章來(lái)源:量子位
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
夢(mèng)晨 西風(fēng) 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAIControlNet作者新項(xiàng)目,居然也搞起大模型和Agent了。
當(dāng)然還是和AI繪畫相關(guān):解決大伙不會(huì)寫提示詞的痛點(diǎn)。
現(xiàn)在只需一句超簡(jiǎn)單的提示詞說明意圖,Agent就會(huì)自己開始“構(gòu)圖”:
a funny cartoon batman fights joker(一幅有趣的卡通蝙蝠俠與小丑戰(zhàn)斗的圖畫)
這就是ControlNet作者Lvmin Zhang的新玩具Omost。Omost這個(gè)名字有雙層含義:
發(fā)音與英文單詞almost(幾乎)相似,意味著每次使用Omost后,用戶所需的圖像幾乎就完成了;
“O”代表“omni”(全能的),“most”表示希望最大限度地利用它。
這個(gè)新項(xiàng)目讓網(wǎng)友直呼:也太強(qiáng)了!
放大翻譯成中文來(lái)看,用戶簡(jiǎn)短的提示詞會(huì)被拆解擴(kuò)展,從圖像全局描述到局部每個(gè)元素的都會(huì)詳細(xì)說明,直觀地指定圖像中各個(gè)元素的位置和大小。
之后,特定圖像生成器根據(jù)LLM描繪的“藍(lán)圖”創(chuàng)建最終的圖像。
而且,已經(jīng)完成的圖像整體布局可以保留,想修改畫面中的某個(gè)元素,也只需一句提示詞。
原版是這樣?jì)饍旱模?br />generate an image
原文鏈接:ControlNet作者搞起大模型:讓天下沒有難寫的生圖提示詞,一句話變構(gòu)圖小作文
聯(lián)系作者
文章來(lái)源:量子位
作者微信:QbitAI
作者簡(jiǎn)介:追蹤人工智能新趨勢(shì),關(guān)注科技行業(yè)新突破