標(biāo)簽:視覺

計(jì)算機(jī)視覺的十年:深度學(xué)習(xí)帶來(lái)變革,經(jīng)典元素仍主導(dǎo)特定挑戰(zhàn)

大數(shù)據(jù)文摘出品編譯:文摘菌近些年來(lái),計(jì)算機(jī)視覺(CV)的發(fā)展勢(shì)如破竹,滲透到了我們生活的方方面面。對(duì)于大眾而言,這可能像是一項(xiàng)新鮮且令人興奮的科技創(chuàng)...
閱讀原文

大語(yǔ)言模型擊敗擴(kuò)散模型!視頻圖像生成雙SOTA,谷歌CMU最新研究,一作北大校友

白交 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI語(yǔ)言模型擊敗擴(kuò)散模型,在視頻和圖像生成上實(shí)現(xiàn)雙SOTA!這是來(lái)自谷歌CMU最新研究成果。據(jù)介紹,這是語(yǔ)言模型第一次在...
閱讀原文

美圖視覺大模型 3.0:讓設(shè)計(jì)師做甲方

AI工作流提效之戰(zhàn)正式開啟。作者丨郭思編輯丨陳彩嫻ChatGPT之前,國(guó)內(nèi)最近一次的AI熱潮是以“AI四小龍”的發(fā)展為代表,但這些公司燒錢程度與落地產(chǎn)出的不匹配,...
閱讀原文

在圖像、視頻生成上,語(yǔ)言模型首次擊敗擴(kuò)散模型,tokenizer是關(guān)鍵

機(jī)器之心報(bào)道編輯:張倩、陳萍為什么語(yǔ)言模型在視覺生成方面落后于擴(kuò)散模型?來(lái)自谷歌、CMU 的研究表明,tokenizer 是關(guān)鍵。大型語(yǔ)言模型(LLM 或 LM)一開始...
閱讀原文

挑戰(zhàn)GPT-4V!清華唐杰&智譜開源多模態(tài)14邊形戰(zhàn)士,在線可玩

夢(mèng)晨 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI看看這張圖中有幾個(gè)房子?如果你回答3個(gè),就和GPT-4V的答案一樣。但是最新開源的國(guó)產(chǎn)多模態(tài)模型CogVLM-17B,就能看出...
閱讀原文

美圖秀秀上車最新自研大模型,各類AIGC玩法可直接體驗(yàn)

明敏 發(fā)自 廈門量子位 | 公眾號(hào) QbitAI美圖自研大模型3.0,正式發(fā)布!并且全面應(yīng)用于美圖旗下影像與設(shè)計(jì)產(chǎn)品。這是自美圖大模型面世100天后的最新迭代。相較...
閱讀原文

野心勃勃的MiniGPT-5出現(xiàn)了!Token變Voken,支持圖文交叉生成

夕小瑤科技說(shuō) 分享來(lái)源 | 機(jī)器之心大模型正在實(shí)現(xiàn)語(yǔ)言和視覺的跨越,有望無(wú)縫地理解和生成文本和圖像內(nèi)容。在最近的一系列研究中,多模態(tài)特征集成不僅是一種...
閱讀原文

前百度高管接手AWS大中華區(qū);英偉達(dá)取消AI峰會(huì);華為劇透小藝語(yǔ)音轉(zhuǎn)寫功能丨AIGC大事日?qǐng)?bào)

10/09全球AIGC產(chǎn)業(yè)要聞1、谷歌前高管出任微軟副總裁 主攻AIGC2、英偉達(dá)宣布取消原定下周的以色列AI峰會(huì)3、百度前副總裁出任亞馬遜云科技大中華區(qū)負(fù)責(zé)人4、百...
閱讀原文

美圖自研視覺大模型3.0發(fā)布!能“腦補(bǔ)”生圖和精準(zhǔn)修圖,100天全面進(jìn)化

邁向AI視覺大模型的未來(lái):萬(wàn)物皆可生成。作者|ZeR0編輯|漠影智東西10月9日?qǐng)?bào)道,今日下午,美圖自研AI視覺大模型MiracleVision(奇想智能)3.0版本發(fā)布,并將...
閱讀原文

統(tǒng)一圖像和文字生成的MiniGPT-5來(lái)了:Token變Voken,模型不僅能續(xù)寫,還會(huì)自動(dòng)配圖了

機(jī)器之心報(bào)道機(jī)器之心編輯部OpenAI 的 GPT-5 大模型似乎還遙遙無(wú)期,但已經(jīng)有研究者率先推出了創(chuàng)新視覺與語(yǔ)言交叉生成的模型 MiniGPT-5。這對(duì)于生成具有連貫...
閱讀原文

正面硬剛GPT-4V!浙大校友開源多模態(tài)大模型LLaVA-1.5,130億參數(shù)8個(gè)A100一天訓(xùn)完

新智元報(bào)道編輯:Aeneas 好困【新智元導(dǎo)讀】GPT-4V風(fēng)頭正盛,LLaVA-1.5就來(lái)踢館了!它不僅在11個(gè)基準(zhǔn)測(cè)試上都實(shí)現(xiàn)了SOTA,而且13B模型的訓(xùn)練,只用8個(gè)A100就...
閱讀原文

微軟發(fā)布多模態(tài)大模型GPT-4V使用指南,長(zhǎng)達(dá)166頁(yè),一文速覽

夕小瑤科技說(shuō) 分享來(lái)源 | 機(jī)器之心作者 | 陳萍、張倩一周之前,ChatGPT迎來(lái)重大更新,不管是 GPT-4 還是 GPT-3.5 模型,都可以基于圖像進(jìn)行分析和對(duì)話。與之...
閱讀原文

鼠鼠我呀,也有VR頭顯了!康奈爾給小鼠開顱,沉浸式研究大腦和行為

新智元報(bào)道編輯:Aeneas【新智元導(dǎo)讀】最近,康奈爾大學(xué)的研究者們,給老鼠也戴上VR頭顯了。雖然擁有了VR體驗(yàn),但鼠鼠們也付出了一些代價(jià)——比如,需要提前做...
閱讀原文

ICCV'23論文頒獎(jiǎng)“神仙打架”!Meta分割一切和ControlNet共同入選,還有一篇讓評(píng)委們很驚訝

克雷西 蕭簫 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI剛剛,計(jì)算機(jī)視覺巔峰大會(huì)ICCV 2023,在法國(guó)巴黎正式“開獎(jiǎng)”!今年的最佳論文獎(jiǎng),簡(jiǎn)直是“神仙打架”。例如,獲...
閱讀原文

微軟最新166頁(yè)測(cè)評(píng)報(bào)告:視覺模態(tài)GPT-4V到底有多強(qiáng)?

本文來(lái)源:機(jī)器之心一周之前,ChatGPT 迎來(lái)重大更新,不管是 GPT-4 還是 GPT-3.5 模型,都可以基于圖像進(jìn)行分析和對(duì)話。與之對(duì)應(yīng)的,多模態(tài)版 GPT-4V 模型相...
閱讀原文
11617181920