視覺如何模型統(tǒng)一?牛津大學(xué)Shuyang Sun博士論文《邁向統(tǒng)一視覺感知》全面闡述
AIGC動態(tài)歡迎閱讀
原標(biāo)題:視覺如何模型統(tǒng)一?牛津大學(xué)Shuyang Sun博士論文《邁向統(tǒng)一視覺感知》全面闡述
關(guān)鍵字:視覺,粒度,報告,任務(wù),模型
文章來源:人工智能學(xué)家
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
來源:專知
來自牛津大學(xué)Shuyang (Kevin) Sun博士論文《Towards Unified Visual Perception 》值得關(guān)注!探討統(tǒng)一視覺感知系統(tǒng)的構(gòu)建。
Shuyang (Kevin) Sun
牛津大學(xué)Torr視覺組的DPhil(博士)學(xué)生,導(dǎo)師為Philip Torr教授和Victor Prisacariu教授。曾在悉尼大學(xué)SIGMA實(shí)驗(yàn)室攻讀碩士學(xué)位,師從Ouyang Wanli教授。有幸與谷歌研究院的Weijun Wang和Liang-Chieh Chen,Intel ISL的Vladlen Koltun、Philipp Kr?henbühl和René Ranftl緊密合作。于2016年在中國大學(xué)獲得軟件工程學(xué)士學(xué)位。目前,他的研究重點(diǎn)是構(gòu)建具有統(tǒng)一感知的綜合視覺系統(tǒng)。
https://kevin-ssy.github.io/
本論文通過利用視覺Transformer(Vision Transformers, ViTs)的能力,探索計(jì)算機(jī)視覺中視覺感知的前沿領(lǐng)域,旨在創(chuàng)建一個統(tǒng)一的框架來應(yīng)對跨任務(wù)和跨粒度的挑戰(zhàn)。我們從人類視覺系統(tǒng)在不同細(xì)節(jié)層次處理
原文鏈接:視覺如何模型統(tǒng)一?牛津大學(xué)Shuyang Sun博士論文《邁向統(tǒng)一視覺感知》全面闡述
聯(lián)系作者
文章來源:人工智能學(xué)家
作者微信:
作者簡介: