標(biāo)簽:視覺
今日arXiv最熱NLP大模型論文:逆向解析Sora背后的秘密,談AI視頻的機(jī)遇與挑戰(zhàn)
夕小瑤科技說 原創(chuàng)作者 | Tscom 引言:Sora——AI在視頻生成領(lǐng)域的新篇章隨著AI技術(shù)的飛速發(fā)展,人工智能已在視頻生成領(lǐng)域翻開新的篇章。自2022年11月ChatGPT問...
專訪上海大學(xué)方昱春教授:數(shù)據(jù)驅(qū)動(dòng)的手語識(shí)別研究,如何數(shù)據(jù)之困?|GAIR live
如何利用計(jì)算機(jī)視覺技術(shù),解析手語的奧秘?作者|吳彤 編輯|麥廣煒 在科技日新月異的今天,手語識(shí)別作為一種新興的跨學(xué)科研究領(lǐng)域,正逐漸走進(jìn)公眾視野。 近...
提升生成式零樣本學(xué)習(xí)能力,視覺增強(qiáng)動(dòng)態(tài)語義原型方法入選CVPR 2024
機(jī)器之心專欄 機(jī)器之心編輯部雖然我從來沒見過你,但是我有可能「認(rèn)識(shí)」你 —— 這是人們希望人工智能在「一眼初見」下達(dá)到的狀態(tài)。 為了達(dá)到這個(gè)目的,在傳統(tǒng)...
Claude 3 Haiku發(fā)布:Anthropic迄今為止最快的模型
點(diǎn)擊上方藍(lán)字關(guān)注我們“Anthropic公司推出最新AI模型Claude 3 Haiku,以高速度和實(shí)惠的價(jià)格脫穎而出。Haiku不僅具備先進(jìn)的視覺功能,還在處理速度上表現(xiàn)出色,...
從第一人稱視角理解世界,多模態(tài)模型離我們還有多遠(yuǎn)?| CVPR 2024
大數(shù)據(jù)文摘受權(quán)轉(zhuǎn)載自將門創(chuàng)投 目前很多評(píng)測(cè)工作探究視覺語言大模型在不同維度上的能力,但都忽視了真實(shí)世界中非常重要的一點(diǎn):未來作為智能體或機(jī)器人的大腦...
今日Arxiv最熱NLP大模型論文:美團(tuán)發(fā)布VisionLLaMA,為視覺生成和理解提供新基線
夕小瑤科技說 原創(chuàng)作者 | 芒果引言:探索統(tǒng)一的視覺與語言模型架構(gòu)在人工智能領(lǐng)域,統(tǒng)一的模型架構(gòu)對(duì)于簡(jiǎn)化模型設(shè)計(jì)、提高模型效率以及促進(jìn)跨領(lǐng)域應(yīng)用具有重...
Sora:大型視覺模型的背景、技術(shù)、局限性和機(jī)遇綜述
點(diǎn)擊上方藍(lán)字關(guān)注我們注:本文翻譯自論文《Sora: A Review on Background, Technology, Limitations, and Opportunities of Large Vision Models》,原作者版...
全面超越ViT,美團(tuán)、浙大等提出視覺任務(wù)統(tǒng)一架構(gòu)VisionLLAMA
機(jī)器之心專欄 機(jī)器之心編輯部半年多來,Meta 開源的 LLaMA 架構(gòu)在 LLM 中經(jīng)受了考驗(yàn)并大獲成功(訓(xùn)練穩(wěn)定、容易做 scaling)。 沿襲 ViT 的研究思路,我們能...
7B模型超越GPT4-V!港科大等發(fā)布「圖推理問答」數(shù)據(jù)集GITQA:視覺圖可提升推理能力
新智元報(bào)道編輯:LRS 好困 【新智元導(dǎo)讀】研究人員證實(shí)了Visual Graph在圖推理中的作用,以及其可以和文本模態(tài)相互增強(qiáng)。圖神經(jīng)網(wǎng)絡(luò)(GNNs)擅長(zhǎng)利用圖的結(jié)構(gòu)...
大視頻模型是世界模型?DeepMind/UC伯克利華人一作:預(yù)測(cè)下一幀就能改變世界
新智元報(bào)道編輯:潤(rùn) 好困 【新智元導(dǎo)讀】谷歌DeepMind、UC伯克利和MIT的研究人員認(rèn)為,如果用大語言模型的思路來做大視頻模型,能解決很多語言模型不擅長(zhǎng)的問...
給AI Agent完整的一生!港大NYU謝賽寧等最新智能體研究:虛擬即現(xiàn)實(shí)
新智元報(bào)道編輯:alan 好困 【新智元導(dǎo)讀】近日,來自香港大學(xué)的Jihan Yang和紐約大學(xué)的謝賽寧等人發(fā)表了新的成果,將真實(shí)世界的地圖、街景等各種信息融入Age...
解剖Sora:37頁論文逆向工程推測(cè)技術(shù)細(xì)節(jié),微軟參與,華人團(tuán)隊(duì)出品
西風(fēng) 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAISora剛發(fā)布不久,就被逆向工程“解剖”了?! 來自理海大學(xué)、微軟研究院的華人團(tuán)隊(duì)發(fā)布了首個(gè)Sora相關(guān)研究綜述,足足有...
中國(guó)如何復(fù)刻Sora,華人團(tuán)隊(duì)長(zhǎng)文解構(gòu)!996 OpenAI研究員:Sora是視頻GPT-2時(shí)刻
新智元報(bào)道編輯:編輯部 【新智元導(dǎo)讀】自曝996作息的OpenAI研究員Jason Wei表示,Sora代表著視頻生成的GPT-2時(shí)刻。競(jìng)爭(zhēng)的關(guān)鍵,就是算力和數(shù)據(jù)了。國(guó)內(nèi)有可...
首個(gè)Sora逆向工程論文發(fā)布!
Sora深度論文綜述中文版。 作者|城主 寫在前面:來自理海大學(xué)和微軟研究院的研究團(tuán)隊(duì)本周二發(fā)布了Sora的深度論文綜述。這里和關(guān)心Sora的同學(xué)們分享本城翻譯制...
首批現(xiàn)場(chǎng)體驗(yàn) AI Pin 的人:為什么我不換臺(tái)手機(jī)呢?
爭(zhēng)議不斷 創(chuàng)意不斷AI Pin 在 MWC 2024(世界移動(dòng)通信大會(huì)) 上的出場(chǎng)方式,和它本身一樣,充滿了爭(zhēng)議。 Humane(AI Pin 母公司) 沒有專屬的展位,因此只能在...
粵公網(wǎng)安備 44011502001135號(hào)