標簽:視覺

計算機視覺的十年:深度學習帶來變革,經(jīng)典元素仍主導特定挑戰(zhàn)

大數(shù)據(jù)文摘出品編譯:文摘菌近些年來,計算機視覺(CV)的發(fā)展勢如破竹,滲透到了我們生活的方方面面。對于大眾而言,這可能像是一項新鮮且令人興奮的科技創(chuàng)...
閱讀原文

大語言模型擊敗擴散模型!視頻圖像生成雙SOTA,谷歌CMU最新研究,一作北大校友

白交 發(fā)自 凹非寺量子位 | 公眾號 QbitAI語言模型擊敗擴散模型,在視頻和圖像生成上實現(xiàn)雙SOTA!這是來自谷歌CMU最新研究成果。據(jù)介紹,這是語言模型第一次在...
閱讀原文

美圖視覺大模型 3.0:讓設計師做甲方

AI工作流提效之戰(zhàn)正式開啟。作者丨郭思編輯丨陳彩嫻ChatGPT之前,國內(nèi)最近一次的AI熱潮是以“AI四小龍”的發(fā)展為代表,但這些公司燒錢程度與落地產(chǎn)出的不匹配,...
閱讀原文

在圖像、視頻生成上,語言模型首次擊敗擴散模型,tokenizer是關鍵

機器之心報道編輯:張倩、陳萍為什么語言模型在視覺生成方面落后于擴散模型?來自谷歌、CMU 的研究表明,tokenizer 是關鍵。大型語言模型(LLM 或 LM)一開始...
閱讀原文

挑戰(zhàn)GPT-4V!清華唐杰&智譜開源多模態(tài)14邊形戰(zhàn)士,在線可玩

夢晨 發(fā)自 凹非寺量子位 | 公眾號 QbitAI看看這張圖中有幾個房子?如果你回答3個,就和GPT-4V的答案一樣。但是最新開源的國產(chǎn)多模態(tài)模型CogVLM-17B,就能看出...
閱讀原文

美圖秀秀上車最新自研大模型,各類AIGC玩法可直接體驗

明敏 發(fā)自 廈門量子位 | 公眾號 QbitAI美圖自研大模型3.0,正式發(fā)布!并且全面應用于美圖旗下影像與設計產(chǎn)品。這是自美圖大模型面世100天后的最新迭代。相較...
閱讀原文

野心勃勃的MiniGPT-5出現(xiàn)了!Token變Voken,支持圖文交叉生成

夕小瑤科技說 分享來源 | 機器之心大模型正在實現(xiàn)語言和視覺的跨越,有望無縫地理解和生成文本和圖像內(nèi)容。在最近的一系列研究中,多模態(tài)特征集成不僅是一種...
閱讀原文

前百度高管接手AWS大中華區(qū);英偉達取消AI峰會;華為劇透小藝語音轉寫功能丨AIGC大事日報

10/09全球AIGC產(chǎn)業(yè)要聞1、谷歌前高管出任微軟副總裁 主攻AIGC2、英偉達宣布取消原定下周的以色列AI峰會3、百度前副總裁出任亞馬遜云科技大中華區(qū)負責人4、百...
閱讀原文

美圖自研視覺大模型3.0發(fā)布!能“腦補”生圖和精準修圖,100天全面進化

邁向AI視覺大模型的未來:萬物皆可生成。作者|ZeR0編輯|漠影智東西10月9日報道,今日下午,美圖自研AI視覺大模型MiracleVision(奇想智能)3.0版本發(fā)布,并將...
閱讀原文

統(tǒng)一圖像和文字生成的MiniGPT-5來了:Token變Voken,模型不僅能續(xù)寫,還會自動配圖了

機器之心報道機器之心編輯部OpenAI 的 GPT-5 大模型似乎還遙遙無期,但已經(jīng)有研究者率先推出了創(chuàng)新視覺與語言交叉生成的模型 MiniGPT-5。這對于生成具有連貫...
閱讀原文

正面硬剛GPT-4V!浙大校友開源多模態(tài)大模型LLaVA-1.5,130億參數(shù)8個A100一天訓完

新智元報道編輯:Aeneas 好困【新智元導讀】GPT-4V風頭正盛,LLaVA-1.5就來踢館了!它不僅在11個基準測試上都實現(xiàn)了SOTA,而且13B模型的訓練,只用8個A100就...
閱讀原文

微軟發(fā)布多模態(tài)大模型GPT-4V使用指南,長達166頁,一文速覽

夕小瑤科技說 分享來源 | 機器之心作者 | 陳萍、張倩一周之前,ChatGPT迎來重大更新,不管是 GPT-4 還是 GPT-3.5 模型,都可以基于圖像進行分析和對話。與之...
閱讀原文

鼠鼠我呀,也有VR頭顯了!康奈爾給小鼠開顱,沉浸式研究大腦和行為

新智元報道編輯:Aeneas【新智元導讀】最近,康奈爾大學的研究者們,給老鼠也戴上VR頭顯了。雖然擁有了VR體驗,但鼠鼠們也付出了一些代價——比如,需要提前做...
閱讀原文

ICCV'23論文頒獎“神仙打架”!Meta分割一切和ControlNet共同入選,還有一篇讓評委們很驚訝

克雷西 蕭簫 發(fā)自 凹非寺量子位 | 公眾號 QbitAI剛剛,計算機視覺巔峰大會ICCV 2023,在法國巴黎正式“開獎”!今年的最佳論文獎,簡直是“神仙打架”。例如,獲...
閱讀原文

微軟最新166頁測評報告:視覺模態(tài)GPT-4V到底有多強?

本文來源:機器之心一周之前,ChatGPT 迎來重大更新,不管是 GPT-4 還是 GPT-3.5 模型,都可以基于圖像進行分析和對話。與之對應的,多模態(tài)版 GPT-4V 模型相...
閱讀原文
11617181920