用視覺(jué)來(lái)做Prompt！沈向洋展示IDEA研究院新模型，無(wú)需訓(xùn)練或微調(diào)，開(kāi)箱即用

AIGC動(dòng)態(tài)2年前 (2023)發(fā)布量子位

AIGC動(dòng)態(tài)歡迎閱讀

原標(biāo)題：用視覺(jué)來(lái)做Prompt！沈向洋展示IDEA研究院新模型，無(wú)需訓(xùn)練或微調(diào)，開(kāi)箱即用

關(guān)鍵字：模型,知識(shí),圖譜,低空,視覺(jué)

文章來(lái)源：量子位

內(nèi)容字?jǐn)?shù)：3553字

內(nèi)容摘要：白交發(fā)自凹非寺量子位 | 公眾號(hào) QbitAI用視覺(jué)來(lái)做Prompt，是種什么體驗(yàn)？只需在圖里隨便框一下，結(jié)果秒秒鐘圈出同一類別！即便是那種GPT-4V都難搞定的數(shù)米粒的環(huán)節(jié)。只需要你手動(dòng)拉一下框，就能找出所有米粒來(lái)。新的目標(biāo)檢測(cè)范式，有了！剛剛結(jié)束的IDEA年度大會(huì)上，IDEA研究院創(chuàng)院理事長(zhǎng)、美國(guó)國(guó)家工程院外籍院士沈向洋展示了最新研究成果——基于視覺(jué)提示（Visual Prompt）模型T-Rex。整個(gè)流程交互，開(kāi)箱即用，只需幾步就可以完成。此前，Meta開(kāi)源的SAM分割一切模型，直接讓CV領(lǐng)域迎來(lái)了GPT-3時(shí)刻，但仍是基于文本prompt的范式，在應(yīng)對(duì)一些復(fù)雜、罕見(jiàn)場(chǎng)景就會(huì)比較難辦。現(xiàn)在以圖換圖的方式，就能輕松迎刃而解。除此之外，整場(chǎng)大會(huì)也是干貨滿滿，比如Think-on-Graph知識(shí)驅(qū)動(dòng)大模型、開(kāi)發(fā)者平臺(tái)MoonBit月兔、AI科研神器ReadPaper更新2.0、SPU機(jī)…

原文鏈接：點(diǎn)此閱讀原文：用視覺(jué)來(lái)做Prompt！沈向洋展示IDEA研究院新模型，無(wú)需訓(xùn)練或微調(diào)，開(kāi)箱即用