標(biāo)簽：視覺

今日arXiv最熱NLP大模型論文：逆向解析Sora背后的秘密，談AI視頻的機(jī)遇與挑戰(zhàn)

夕小瑤科技說原創(chuàng)作者 | Tscom 引言：Sora——AI在視頻生成領(lǐng)域的新篇章隨著AI技術(shù)的飛速發(fā)展，人工智能已在視頻生成領(lǐng)域翻開新的篇章。自2022年11月ChatGPT問...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2024)

專訪上海大學(xué)方昱春教授：數(shù)據(jù)驅(qū)動(dòng)的手語識(shí)別研究，如何數(shù)據(jù)之困？｜GAIR live

如何利用計(jì)算機(jī)視覺技術(shù)，解析手語的奧秘？作者｜吳彤編輯｜麥廣煒在科技日新月異的今天，手語識(shí)別作為一種新興的跨學(xué)科研究領(lǐng)域，正逐漸走進(jìn)公眾視野。近...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2024)

提升生成式零樣本學(xué)習(xí)能力，視覺增強(qiáng)動(dòng)態(tài)語義原型方法入選CVPR 2024

機(jī)器之心專欄機(jī)器之心編輯部雖然我從來沒見過你，但是我有可能「認(rèn)識(shí)」你 —— 這是人們希望人工智能在「一眼初見」下達(dá)到的狀態(tài)。為了達(dá)到這個(gè)目的，在傳統(tǒng)...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2024)

Claude 3 Haiku發(fā)布：Anthropic迄今為止最快的模型

點(diǎn)擊上方藍(lán)字關(guān)注我們“Anthropic公司推出最新AI模型Claude 3 Haiku，以高速度和實(shí)惠的價(jià)格脫穎而出。Haiku不僅具備先進(jìn)的視覺功能，還在處理速度上表現(xiàn)出色，...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2024)

從第一人稱視角理解世界，多模態(tài)模型離我們還有多遠(yuǎn)？| CVPR 2024

大數(shù)據(jù)文摘受權(quán)轉(zhuǎn)載自將門創(chuàng)投目前很多評(píng)測(cè)工作探究視覺語言大模型在不同維度上的能力，但都忽視了真實(shí)世界中非常重要的一點(diǎn)：未來作為智能體或機(jī)器人的大腦...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2024)

今日Arxiv最熱NLP大模型論文：美團(tuán)發(fā)布VisionLLaMA，為視覺生成和理解提供新基線

夕小瑤科技說原創(chuàng)作者 | 芒果引言：探索統(tǒng)一的視覺與語言模型架構(gòu)在人工智能領(lǐng)域，統(tǒng)一的模型架構(gòu)對(duì)于簡(jiǎn)化模型設(shè)計(jì)、提高模型效率以及促進(jìn)跨領(lǐng)域應(yīng)用具有重...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2024)

Sora：大型視覺模型的背景、技術(shù)、局限性和機(jī)遇綜述

點(diǎn)擊上方藍(lán)字關(guān)注我們注：本文翻譯自論文《Sora: A Review on Background, Technology, Limitations, and Opportunities of Large Vision Models》，原作者版...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2024)

全面超越ViT，美團(tuán)、浙大等提出視覺任務(wù)統(tǒng)一架構(gòu)VisionLLAMA

機(jī)器之心專欄機(jī)器之心編輯部半年多來，Meta 開源的 LLaMA 架構(gòu)在 LLM 中經(jīng)受了考驗(yàn)并大獲成功（訓(xùn)練穩(wěn)定、容易做 scaling）。沿襲 ViT 的研究思路，我們能...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2024)

7B模型超越GPT4-V！港科大等發(fā)布「圖推理問答」數(shù)據(jù)集GITQA：視覺圖可提升推理能力

新智元報(bào)道編輯：LRS 好困【新智元導(dǎo)讀】研究人員證實(shí)了Visual Graph在圖推理中的作用，以及其可以和文本模態(tài)相互增強(qiáng)。圖神經(jīng)網(wǎng)絡(luò)（GNNs）擅長(zhǎng)利用圖的結(jié)構(gòu)...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2024)

大視頻模型是世界模型？DeepMind/UC伯克利華人一作：預(yù)測(cè)下一幀就能改變世界

新智元報(bào)道編輯：潤(rùn) 好困【新智元導(dǎo)讀】谷歌DeepMind、UC伯克利和MIT的研究人員認(rèn)為，如果用大語言模型的思路來做大視頻模型，能解決很多語言模型不擅長(zhǎng)的問...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2024)

給AI Agent完整的一生！港大NYU謝賽寧等最新智能體研究：虛擬即現(xiàn)實(shí)

新智元報(bào)道編輯：alan 好困【新智元導(dǎo)讀】近日，來自香港大學(xué)的Jihan Yang和紐約大學(xué)的謝賽寧等人發(fā)表了新的成果，將真實(shí)世界的地圖、街景等各種信息融入Age...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2024)

解剖Sora：37頁論文逆向工程推測(cè)技術(shù)細(xì)節(jié)，微軟參與，華人團(tuán)隊(duì)出品

西風(fēng) 發(fā)自凹非寺量子位 | 公眾號(hào) QbitAISora剛發(fā)布不久，就被逆向工程“解剖”了？！來自理海大學(xué)、微軟研究院的華人團(tuán)隊(duì)發(fā)布了首個(gè)Sora相關(guān)研究綜述，足足有...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2024)

中國(guó)如何復(fù)刻Sora，華人團(tuán)隊(duì)長(zhǎng)文解構(gòu)！996 OpenAI研究員：Sora是視頻GPT-2時(shí)刻

新智元報(bào)道編輯：編輯部【新智元導(dǎo)讀】自曝996作息的OpenAI研究員Jason Wei表示，Sora代表著視頻生成的GPT-2時(shí)刻。競(jìng)爭(zhēng)的關(guān)鍵，就是算力和數(shù)據(jù)了。國(guó)內(nèi)有可...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2024)

首個(gè)Sora逆向工程論文發(fā)布！

Sora深度論文綜述中文版。作者|城主寫在前面：來自理海大學(xué)和微軟研究院的研究團(tuán)隊(duì)本周二發(fā)布了Sora的深度論文綜述。這里和關(guān)心Sora的同學(xué)們分享本城翻譯制...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2024)

首批現(xiàn)場(chǎng)體驗(yàn) AI Pin 的人：為什么我不換臺(tái)手機(jī)呢？

爭(zhēng)議不斷創(chuàng)意不斷AI Pin 在 MWC 2024（世界移動(dòng)通信大會(huì)）上的出場(chǎng)方式，和它本身一樣，充滿了爭(zhēng)議。 Humane（AI Pin 母公司）沒有專屬的展位，因此只能在...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2024)

1…9 101112 13…20