標簽：視覺

計算機視覺的十年：深度學習帶來變革，經(jīng)典元素仍主導特定挑戰(zhàn)

大數(shù)據(jù)文摘出品編譯：文摘菌近些年來，計算機視覺（CV）的發(fā)展勢如破竹，滲透到了我們生活的方方面面。對于大眾而言，這可能像是一項新鮮且令人興奮的科技創(chuàng)...

閱讀原文

AIGC動態(tài)

2年前 (2023)

大語言模型擊敗擴散模型！視頻圖像生成雙SOTA，谷歌CMU最新研究，一作北大校友

白交發(fā)自凹非寺量子位 | 公眾號 QbitAI語言模型擊敗擴散模型，在視頻和圖像生成上實現(xiàn)雙SOTA！這是來自谷歌CMU最新研究成果。據(jù)介紹，這是語言模型第一次在...

閱讀原文

AIGC動態(tài)

2年前 (2023)

美圖視覺大模型 3.0：讓設計師做甲方

AI工作流提效之戰(zhàn)正式開啟。作者丨郭思編輯丨陳彩嫻ChatGPT之前，國內(nèi)最近一次的AI熱潮是以“AI四小龍”的發(fā)展為代表，但這些公司燒錢程度與落地產(chǎn)出的不匹配，...

閱讀原文

AIGC動態(tài)

2年前 (2023)

在圖像、視頻生成上，語言模型首次擊敗擴散模型，tokenizer是關鍵

機器之心報道編輯：張倩、陳萍為什么語言模型在視覺生成方面落后于擴散模型？來自谷歌、CMU 的研究表明，tokenizer 是關鍵。大型語言模型（LLM 或 LM）一開始...

閱讀原文

AIGC動態(tài)

2年前 (2023)

挑戰(zhàn)GPT-4V！清華唐杰&智譜開源多模態(tài)14邊形戰(zhàn)士，在線可玩

夢晨發(fā)自凹非寺量子位 | 公眾號 QbitAI看看這張圖中有幾個房子？如果你回答3個，就和GPT-4V的答案一樣。但是最新開源的國產(chǎn)多模態(tài)模型CogVLM-17B，就能看出...

閱讀原文

AIGC動態(tài)

2年前 (2023)

美圖秀秀上車最新自研大模型，各類AIGC玩法可直接體驗

明敏發(fā)自廈門量子位 | 公眾號 QbitAI美圖自研大模型3.0，正式發(fā)布！并且全面應用于美圖旗下影像與設計產(chǎn)品。這是自美圖大模型面世100天后的最新迭代。相較...

閱讀原文

AIGC動態(tài)

2年前 (2023)

野心勃勃的MiniGPT-5出現(xiàn)了！Token變Voken，支持圖文交叉生成

夕小瑤科技說分享來源 | 機器之心大模型正在實現(xiàn)語言和視覺的跨越，有望無縫地理解和生成文本和圖像內(nèi)容。在最近的一系列研究中，多模態(tài)特征集成不僅是一種...

閱讀原文

AIGC動態(tài)

2年前 (2023)

前百度高管接手AWS大中華區(qū)；英偉達取消AI峰會；華為劇透小藝語音轉寫功能丨AIGC大事日報

10/09全球AIGC產(chǎn)業(yè)要聞1、谷歌前高管出任微軟副總裁主攻AIGC2、英偉達宣布取消原定下周的以色列AI峰會3、百度前副總裁出任亞馬遜云科技大中華區(qū)負責人4、百...

閱讀原文

AIGC動態(tài)

2年前 (2023)

美圖自研視覺大模型3.0發(fā)布！能“腦補”生圖和精準修圖，100天全面進化

邁向AI視覺大模型的未來：萬物皆可生成。作者|ZeR0編輯|漠影智東西10月9日報道，今日下午，美圖自研AI視覺大模型MiracleVision（奇想智能）3.0版本發(fā)布，并將...

閱讀原文

AIGC動態(tài)

2年前 (2023)

統(tǒng)一圖像和文字生成的MiniGPT-5來了：Token變Voken，模型不僅能續(xù)寫，還會自動配圖了

機器之心報道機器之心編輯部OpenAI 的 GPT-5 大模型似乎還遙遙無期，但已經(jīng)有研究者率先推出了創(chuàng)新視覺與語言交叉生成的模型 MiniGPT-5。這對于生成具有連貫...

閱讀原文

AIGC動態(tài)

2年前 (2023)

正面硬剛GPT-4V！浙大校友開源多模態(tài)大模型LLaVA-1.5，130億參數(shù)8個A100一天訓完

新智元報道編輯：Aeneas 好困【新智元導讀】GPT-4V風頭正盛，LLaVA-1.5就來踢館了！它不僅在11個基準測試上都實現(xiàn)了SOTA，而且13B模型的訓練，只用8個A100就...

閱讀原文

AIGC動態(tài)

2年前 (2023)

微軟發(fā)布多模態(tài)大模型GPT-4V使用指南，長達166頁，一文速覽

夕小瑤科技說分享來源 | 機器之心作者 | 陳萍、張倩一周之前，ChatGPT迎來重大更新，不管是 GPT-4 還是 GPT-3.5 模型，都可以基于圖像進行分析和對話。與之...

閱讀原文

AIGC動態(tài)

2年前 (2023)

鼠鼠我呀，也有VR頭顯了！康奈爾給小鼠開顱，沉浸式研究大腦和行為

新智元報道編輯：Aeneas【新智元導讀】最近，康奈爾大學的研究者們，給老鼠也戴上VR頭顯了。雖然擁有了VR體驗，但鼠鼠們也付出了一些代價——比如，需要提前做...

閱讀原文

AIGC動態(tài)

2年前 (2023)

ICCV'23論文頒獎“神仙打架”！Meta分割一切和ControlNet共同入選，還有一篇讓評委們很驚訝

克雷西蕭簫發(fā)自凹非寺量子位 | 公眾號 QbitAI剛剛，計算機視覺巔峰大會ICCV 2023，在法國巴黎正式“開獎”！今年的最佳論文獎，簡直是“神仙打架”。例如，獲...

閱讀原文

AIGC動態(tài)

2年前 (2023)

微軟最新166頁測評報告：視覺模態(tài)GPT-4V到底有多強？

本文來源：機器之心一周之前，ChatGPT 迎來重大更新，不管是 GPT-4 還是 GPT-3.5 模型，都可以基于圖像進行分析和對話。與之對應的，多模態(tài)版 GPT-4V 模型相...

閱讀原文

AIGC動態(tài)

2年前 (2023)

1…16 171819 20