標簽:圖片

北大最新多模態大模型開源:在混合數據集上訓練,無需修改直接用到圖像視頻任務

一個北大投稿 發送至 凹非寺量子位 | 公眾號 QbitAI訓完130億參數通用視覺語言大模型,只需3天!北大和中山大學團隊又出招了——在最新研究中,研究團隊提出了...
閱讀原文

太可怕了!AI虛假圖片已經達到了新聞攝影獲獎的程度…

夕小瑤科技說 原創作者 | 楊燦首先請大家看一副入圍新聞攝影獲獎的作品:戰爭期間,一名受傷的以色列年輕女子正痛苦地抓著士兵的手臂。這抓拍的角度,這女子...
閱讀原文

訓練130億大模型僅3天,北大提出Chat-UniVi統一圖片和視頻理解

機器之心專欄機器之心編輯部北京大學和中山大學等機構研究者提出了統一的視覺語言大模型 ——Chat-UniVi。通過構建圖片和視頻統一表征,該框架使得一個 LLM 能...
閱讀原文

視頻生成新突破:PixelDance,輕松呈現復雜動作與炫酷特效

機器之心報道機器之心編輯部AI 生成的視頻終于能動了。最近,除了大語言模型繼續持續刷屏,視頻生成技術也取得了重大進展,多家公司相繼發布了新模型。首先,...
閱讀原文

提前對齊,視頻問答新SOTA!北大全新Video-LLaVA視覺語言大模型,秒懂視頻笑點

新智元報道編輯:好困【新智元導讀】最近,來自北京大學等機構研究者提出了一種全新視覺語言大模型——Video-LLaVA,使得LLM能夠同時接收圖片和視頻為輸入。Vid...
閱讀原文

真正實現一步文生圖,谷歌UFOGen極速采樣,生成高質量圖像

機器之心專欄機器之心編輯部最近一年來,以 Stable Diffusion 為代表的一系列文生圖擴散模型徹底改變了視覺創作領域。數不清的用戶通過擴散模型產生的圖片提...
閱讀原文

對標 Switch,升級擠牙膏,這臺剛更新的掌機背刺老玩家了嗎

掌機的緩慢前行10 號凌晨的一條游戲主機新聞,引起了兩撥人的叫喊。Steam Deck OLED 官宣新聞. 圖片來自:theverge.com游戲公司 Valve 在官網推出了全新 Stea...
閱讀原文

DALL·E 3=Midjourney+PS?OpenAI悄悄推出「種子」功能,生圖之后還能精修

新智元報道編輯:潤【新智元導讀】OpenAI又再暗暗更新了,新推出的種子功能可以讓用戶精修自己生成的圖片,添加元素,改變視角,調光修色都沒問題!今天網上...
閱讀原文

更高清寫實的人體生成模型HyperHuman來了,基于隱式結構擴散,刷新多項SOTA

機器之心專欄作者:Snap研究院,香港中文大學,香港大學,南洋理工大學論文地址: https://arxiv.org/pdf/2310.08579.pdfGithub 地址: https://github.com/sna...
閱讀原文

Midjourney重大升級,網頁版正式上線!生成圖像真實清晰

新智元報道編輯:貝果【新智元導讀】AI圖像Midjourney進行了重大更新,將其服務完全遷移到瀏覽器上,以提供更多功能和改善用戶體驗。就在昨天,AI圖像Midjour...
閱讀原文

GPT-4和DALL·E 3徹底懵逼,這到底是「?!惯€是「鯊」

夕小瑤科技說 原創作者 | 付奶茶、王二狗大離譜!我用GPT-4(V)和DALL·E 3 「混合雙打」之下,生成了一張張 牛鯊??圖,那么問題來了,這到底是牛還是鯊?起因...
閱讀原文

GPT-4V被曝離譜bug:突然執行神秘代碼,空白圖片讀出打折信息,網友們都看呆了

豐色 明敏 發自 凹非寺量子位 | 公眾號 QbitAIGPT-4V出現驚天bug?!原本只是讓它分析一張圖片,結果它直接犯了致命安全問題,把聊天記錄都給抖落出來了。只...
閱讀原文

千萬人圍觀「燒焦嬰兒」圖片!伯克利教授辟謠:AI圖片檢測器無用

新智元報道編輯:桃子 潤【新智元導讀】AI無法打敗AI,不是沒有道理。近來,上千萬人圍觀的嬰兒死亡照片,AI檢測工具竟無法給出一致答案。AI圖片檢測器又被沖...
閱讀原文

NeurIPS 2023 Spotlight|高質量多視角圖像生成,完美復刻場景材質!SFU等提出MVDiffusion

新智元報道編輯:LRS 好困【新智元導讀】不怕多視角圖像變化大,MVDiffusion整合圖片全局意識,內容一致性更高!逼真的圖像生成在虛擬現實、增強現實、視頻游...
閱讀原文

手把手教你用AI制作國慶節微信紅包封面,詳細教程來了!

在數字化時代,微信紅包已經成為了人們之間交流、互動的一種新方式。而微信紅包封面更是為其賦予了更多個性化、定制化的可能。那么,如何制作一款屬于自己的...
閱讀原文
13456