標(biāo)簽:圖像
AI 也會(huì)戴有色眼鏡?一文揭露圖像生成中的刻板印象
?夕小瑤科技說(shuō) 原創(chuàng)作者|智商掉了一地、Python眾所周知,刻板印象具有高度主觀性,就好比給出關(guān)鍵詞“神探”,不同觀眾可能會(huì)聯(lián)想到截然不同的答案。 ▲圖1 神探...
碑谷式錯(cuò)覺(jué)圖像都被「看穿」,港大、TikTok的Depth Anything火了
機(jī)器之心報(bào)道 編輯:Panda、蛋醬人類有兩只眼睛來(lái)估計(jì)視覺(jué)環(huán)境的深度信息,但機(jī)器人和 VR 頭社等設(shè)備卻往往沒(méi)有這樣的「配置」,往往只能靠單個(gè)攝像頭或單張...
世界頂尖多模態(tài)大模型開(kāi)源!又是零一萬(wàn)物,又是李開(kāi)復(fù)
允中 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI領(lǐng)跑中英文兩大權(quán)威榜單,李開(kāi)復(fù)零一萬(wàn)物交出多模態(tài)大模型答卷! 距離其首款開(kāi)源大模型Yi-34B和Yi-6B的發(fā)布,僅間隔...
零一萬(wàn)物發(fā)布Yi-VL多模態(tài)語(yǔ)言模型并開(kāi)源,測(cè)評(píng)僅次于GPT-4V
作者 | 褚杏娟 1 月 22 日,零一萬(wàn)物發(fā)布 Yi Vision Language(Yi-VL)多模態(tài)語(yǔ)言大模型,并正式面向全球開(kāi)源。Yi-VL 模型基于 Yi 語(yǔ)言模型開(kāi)發(fā),包括 Yi-VL-...
零一萬(wàn)物Yi-VL多模態(tài)大模型開(kāi)源,MMMU、CMMMU兩大權(quán)威榜單領(lǐng)先
機(jī)器之心發(fā)布 機(jī)器之心編輯部1 月 22 日,零一萬(wàn)物 Yi 系列模型家族迎來(lái)新成員:Yi Vision Language(Yi-VL)多模態(tài)語(yǔ)言大模型正式面向全球開(kāi)源。據(jù)悉,Yi-VL...
一張照片,為深度學(xué)習(xí)巨頭們定制人像圖片
機(jī)器之心專欄 作者:InstantX 團(tuán)隊(duì)主題驅(qū)動(dòng)的文本到圖像生成,通常需要在多張包含該主題(如人物、風(fēng)格)的數(shù)據(jù)集上進(jìn)行訓(xùn)練,這類方法中的代表工作包括 Drea...
GPT-4V慘敗!CV大神謝賽寧新作:V*重磅「視覺(jué)搜索」算法讓LLM理解力逼近人類
新智元報(bào)道編輯:桃子 【新智元導(dǎo)讀】多模態(tài)大模型GPT-4V也會(huì)「有眼無(wú)珠」。UC San Diego紐約大學(xué)研究人員提出全新V*視覺(jué)搜索算法逆轉(zhuǎn)LLM弱視覺(jué)宿命。Sam Alt...
Midjourney V6超進(jìn)化,大神網(wǎng)友深度評(píng)測(cè)來(lái)了!畫質(zhì)逼真到可怕,人像圖片令人驚呆
新智元報(bào)道編輯:Aeneas 【新智元導(dǎo)讀】Midjourney大神的超深度測(cè)評(píng)來(lái)了!V6比起V5.2究竟有哪些改進(jìn)?來(lái)感受一下吧。最近,國(guó)外的一位名叫Andrei Kovalev的大...
視覺(jué)Mamba來(lái)了:速度提升2.8倍,內(nèi)存能省87%
機(jī)器之心報(bào)道 編輯:陳萍、澤南Vision Mamba 不是個(gè)普通模型。號(hào)稱「全面包圍 Transformer」的 Mamba,推出不到兩個(gè)月就有了高性能的視覺(jué)版。 本周四,來(lái)自華...
多模態(tài)訓(xùn)練,怎么對(duì)齊不同模態(tài)?
直播預(yù)告 | 1月22日晚7點(diǎn),「自動(dòng)駕駛新青年講座」第35講正式開(kāi)講,LMDrive一作、香港中文大學(xué)MMLab在讀博士邵昊將主講《LMDrive:大語(yǔ)言模型加持的閉環(huán)端到...
20%的楊冪+80%的泰勒長(zhǎng)什么樣?小紅書(shū)風(fēng)格化AI來(lái)了,可兼容SD和ControlNet
豐色 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI不得不說(shuō),現(xiàn)在拍寫真真是“簡(jiǎn)單到放肆”了。 真人不用出鏡,不用費(fèi)心凹姿勢(shì)、搞發(fā)型,只需一張本人圖像,等待幾秒鐘,...
AI生圖界扛把子被曝剽竊!復(fù)制粘貼好萊塢大片,Midjourney、OpenAI都中槍了
一個(gè)單詞,讓AI生成堪比電影截圖的鋼鐵俠? 編譯|香草 編輯|李水青 以下這組圖,你能分辨出哪些是電影截圖,哪些是AI生成的圖像嗎? ▲Midjourney生成圖像與原...
「文生圖」再升級(jí)!學(xué)習(xí)個(gè)性化參照,無(wú)限生成多樣圖片,輕松設(shè)計(jì)玩具建筑
新智元報(bào)道編輯:LRS 【新智元導(dǎo)讀】將圖片集反演到語(yǔ)義空間的分布,生成多樣個(gè)性化圖片或3D渲染,支持靈活文本編輯、多樣性控制、概念混合等。最近,來(lái)自南...
OpenAI將推出新的AI工具,旨在防止美國(guó)大選期間虛假信息傳播
夕小瑤科技說(shuō) 原創(chuàng)作者 | 松果、王二狗2024 年是美國(guó)總統(tǒng)的大選年,然而每到大選之時(shí),虛假信息泛濫等問(wèn)題一直都很嚴(yán)重。美國(guó)一項(xiàng)民意調(diào)查發(fā)現(xiàn),近60%的成年...
微軟Copilot Pro來(lái)了:個(gè)人用戶也能在Word里用GPT-4,20美元/月
魚(yú)羊 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI面向個(gè)人用戶的微軟Copilot會(huì)員版來(lái)了。 一個(gè)月多交20刀(約合人民幣142元),Microsoft 365個(gè)人版/家庭版用戶就能在...