用視覺(jué)來(lái)做Prompt!沈向洋展示IDEA研究院新模型,無(wú)需訓(xùn)練或微調(diào),開(kāi)箱即用

AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:用視覺(jué)來(lái)做Prompt!沈向洋展示IDEA研究院新模型,無(wú)需訓(xùn)練或微調(diào),開(kāi)箱即用
關(guān)鍵字:模型,知識(shí),圖譜,低空,視覺(jué)
文章來(lái)源:量子位
內(nèi)容字?jǐn)?shù):3553字
內(nèi)容摘要:白交 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI用視覺(jué)來(lái)做Prompt,是種什么體驗(yàn)?只需在圖里隨便框一下,結(jié)果秒秒鐘圈出同一類別!即便是那種GPT-4V都難搞定的數(shù)米粒的環(huán)節(jié)。只需要你手動(dòng)拉一下框,就能找出所有米粒來(lái)。新的目標(biāo)檢測(cè)范式,有了!剛剛結(jié)束的IDEA年度大會(huì)上,IDEA研究院創(chuàng)院理事長(zhǎng)、美國(guó)國(guó)家工程院外籍院士沈向洋展示了最新研究成果——基于視覺(jué)提示(Visual Prompt)模型T-Rex。整個(gè)流程交互,開(kāi)箱即用,只需幾步就可以完成。此前,Meta開(kāi)源的SAM分割一切模型,直接讓CV領(lǐng)域迎來(lái)了GPT-3時(shí)刻,但仍是基于文本prompt的范式,在應(yīng)對(duì)一些復(fù)雜、罕見(jiàn)場(chǎng)景就會(huì)比較難辦。現(xiàn)在以圖換圖的方式,就能輕松迎刃而解。除此之外,整場(chǎng)大會(huì)也是干貨滿滿,比如Think-on-Graph知識(shí)驅(qū)動(dòng)大模型、開(kāi)發(fā)者平臺(tái)MoonBit月兔、AI科研神器ReadPaper更新2.0、SPU機(jī)…
原文鏈接:點(diǎn)此閱讀原文:用視覺(jué)來(lái)做Prompt!沈向洋展示IDEA研究院新模型,無(wú)需訓(xùn)練或微調(diào),開(kāi)箱即用
聯(lián)系作者
文章來(lái)源:量子位
作者微信:QbitAI
作者簡(jiǎn)介:追蹤人工智能新趨勢(shì),關(guān)注科技行業(yè)新突破

粵公網(wǎng)安備 44011502001135號(hào)