標(biāo)簽:圖片

北大最新多模態(tài)大模型開源:在混合數(shù)據(jù)集上訓(xùn)練,無需修改直接用到圖像視頻任務(wù)

一個北大投稿 發(fā)送至 凹非寺量子位 | 公眾號 QbitAI訓(xùn)完130億參數(shù)通用視覺語言大模型,只需3天!北大和中山大學(xué)團隊又出招了——在最新研究中,研究團隊提出了...
閱讀原文

太可怕了!AI虛假圖片已經(jīng)達(dá)到了新聞攝影獲獎的程度…

夕小瑤科技說 原創(chuàng)作者 | 楊燦首先請大家看一副入圍新聞攝影獲獎的作品:戰(zhàn)爭期間,一名受傷的以色列年輕女子正痛苦地抓著士兵的手臂。這抓拍的角度,這女子...
閱讀原文

訓(xùn)練130億大模型僅3天,北大提出Chat-UniVi統(tǒng)一圖片和視頻理解

機器之心專欄機器之心編輯部北京大學(xué)和中山大學(xué)等機構(gòu)研究者提出了統(tǒng)一的視覺語言大模型 ——Chat-UniVi。通過構(gòu)建圖片和視頻統(tǒng)一表征,該框架使得一個 LLM 能...
閱讀原文

視頻生成新突破:PixelDance,輕松呈現(xiàn)復(fù)雜動作與炫酷特效

機器之心報道機器之心編輯部AI 生成的視頻終于能動了。最近,除了大語言模型繼續(xù)持續(xù)刷屏,視頻生成技術(shù)也取得了重大進展,多家公司相繼發(fā)布了新模型。首先,...
閱讀原文

提前對齊,視頻問答新SOTA!北大全新Video-LLaVA視覺語言大模型,秒懂視頻笑點

新智元報道編輯:好困【新智元導(dǎo)讀】最近,來自北京大學(xué)等機構(gòu)研究者提出了一種全新視覺語言大模型——Video-LLaVA,使得LLM能夠同時接收圖片和視頻為輸入。Vid...
閱讀原文

真正實現(xiàn)一步文生圖,谷歌UFOGen極速采樣,生成高質(zhì)量圖像

機器之心專欄機器之心編輯部最近一年來,以 Stable Diffusion 為代表的一系列文生圖擴散模型徹底改變了視覺創(chuàng)作領(lǐng)域。數(shù)不清的用戶通過擴散模型產(chǎn)生的圖片提...
閱讀原文

對標(biāo) Switch,升級擠牙膏,這臺剛更新的掌機背刺老玩家了嗎

掌機的緩慢前行10 號凌晨的一條游戲主機新聞,引起了兩撥人的叫喊。Steam Deck OLED 官宣新聞. 圖片來自:theverge.com游戲公司 Valve 在官網(wǎng)推出了全新 Stea...
閱讀原文

DALL·E 3=Midjourney+PS?OpenAI悄悄推出「種子」功能,生圖之后還能精修

新智元報道編輯:潤【新智元導(dǎo)讀】OpenAI又再暗暗更新了,新推出的種子功能可以讓用戶精修自己生成的圖片,添加元素,改變視角,調(diào)光修色都沒問題!今天網(wǎng)上...
閱讀原文

更高清寫實的人體生成模型HyperHuman來了,基于隱式結(jié)構(gòu)擴散,刷新多項SOTA

機器之心專欄作者:Snap研究院,香港中文大學(xué),香港大學(xué),南洋理工大學(xué)論文地址: https://arxiv.org/pdf/2310.08579.pdfGithub 地址: https://github.com/sna...
閱讀原文

Midjourney重大升級,網(wǎng)頁版正式上線!生成圖像真實清晰

新智元報道編輯:貝果【新智元導(dǎo)讀】AI圖像Midjourney進行了重大更新,將其服務(wù)完全遷移到瀏覽器上,以提供更多功能和改善用戶體驗。就在昨天,AI圖像Midjour...
閱讀原文

GPT-4和DALL·E 3徹底懵逼,這到底是「牛」還是「鯊」

夕小瑤科技說 原創(chuàng)作者 | 付奶茶、王二狗大離譜!我用GPT-4(V)和DALL·E 3 「混合雙打」之下,生成了一張張 牛鯊??圖,那么問題來了,這到底是牛還是鯊?起因...
閱讀原文

GPT-4V被曝離譜bug:突然執(zhí)行神秘代碼,空白圖片讀出打折信息,網(wǎng)友們都看呆了

豐色 明敏 發(fā)自 凹非寺量子位 | 公眾號 QbitAIGPT-4V出現(xiàn)驚天bug?!原本只是讓它分析一張圖片,結(jié)果它直接犯了致命安全問題,把聊天記錄都給抖落出來了。只...
閱讀原文

千萬人圍觀「燒焦嬰兒」圖片!伯克利教授辟謠:AI圖片檢測器無用

新智元報道編輯:桃子 潤【新智元導(dǎo)讀】AI無法打敗AI,不是沒有道理。近來,上千萬人圍觀的嬰兒死亡照片,AI檢測工具竟無法給出一致答案。AI圖片檢測器又被沖...
閱讀原文

NeurIPS 2023 Spotlight|高質(zhì)量多視角圖像生成,完美復(fù)刻場景材質(zhì)!SFU等提出MVDiffusion

新智元報道編輯:LRS 好困【新智元導(dǎo)讀】不怕多視角圖像變化大,MVDiffusion整合圖片全局意識,內(nèi)容一致性更高!逼真的圖像生成在虛擬現(xiàn)實、增強現(xiàn)實、視頻游...
閱讀原文

手把手教你用AI制作國慶節(jié)微信紅包封面,詳細(xì)教程來了!

在數(shù)字化時代,微信紅包已經(jīng)成為了人們之間交流、互動的一種新方式。而微信紅包封面更是為其賦予了更多個性化、定制化的可能。那么,如何制作一款屬于自己的...
閱讀原文
13456