用視覺來做Prompt!沈向洋展示IDEA研究院新模型,無需訓練或微調(diào),開箱即用
AIGC動態(tài)歡迎閱讀
原標題:用視覺來做Prompt!沈向洋展示IDEA研究院新模型,無需訓練或微調(diào),開箱即用
文章來源:量子位
內(nèi)容字數(shù):3553字
內(nèi)容摘要:白交 發(fā)自 凹非寺量子位 | 公眾號 QbitAI用視覺來做Prompt,是種什么體驗?只需在圖里隨便框一下,結(jié)果秒秒鐘圈出同一類別!即便是那種GPT-4V都難搞定的數(shù)米粒的環(huán)節(jié)。只需要你手動拉一下框,就能找出所有米粒來。新的目標檢測范式,有了!剛剛結(jié)束的IDEA年度大會上,IDEA研究院創(chuàng)院理事長、美國國家工程院外籍院士沈向洋展示了最新研究成果——基于視覺提示(Visual Prompt)模型T-Rex。整個流程交互,開箱即用,只需幾步就可以完成。此前,Meta開源的SAM分割一切模型,直接讓CV領(lǐng)域迎來了GPT-3時刻,但仍是基于文本prompt的范式,在應(yīng)對一些復雜、罕見場景就會比較難辦。現(xiàn)在以圖換圖的方式,就能輕松迎刃而解。除此之外,整場大會也是干貨滿滿,比如Think-on-Graph知識驅(qū)動大模型、開發(fā)者平臺MoonBit月兔、AI科研神器ReadPaper更新2.0、SPU機…
原文鏈接:點此閱讀原文:用視覺來做Prompt!沈向洋展示IDEA研究院新模型,無需訓練或微調(diào),開箱即用
聯(lián)系作者
文章來源:量子位
作者微信:QbitAI
作者簡介:追蹤人工智能新趨勢,關(guān)注科技行業(yè)新突破
? 版權(quán)聲明
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載。
相關(guān)文章
暫無評論...