標(biāo)簽：圖片

北大最新多模態(tài)大模型開源：在混合數(shù)據(jù)集上訓(xùn)練，無需修改直接用到圖像視頻任務(wù)

一個北大投稿發(fā)送至凹非寺量子位 | 公眾號 QbitAI訓(xùn)完130億參數(shù)通用視覺語言大模型，只需3天！北大和中山大學(xué)團隊又出招了——在最新研究中，研究團隊提出了...

閱讀原文

AIGC動態(tài)

2年前 (2023)

太可怕了！AI虛假圖片已經(jīng)達(dá)到了新聞攝影獲獎的程度…

夕小瑤科技說原創(chuàng)作者 | 楊燦首先請大家看一副入圍新聞攝影獲獎的作品：戰(zhàn)爭期間，一名受傷的以色列年輕女子正痛苦地抓著士兵的手臂。這抓拍的角度，這女子...

閱讀原文

AIGC動態(tài)

2年前 (2023)

訓(xùn)練130億大模型僅3天，北大提出Chat-UniVi統(tǒng)一圖片和視頻理解

機器之心專欄機器之心編輯部北京大學(xué)和中山大學(xué)等機構(gòu)研究者提出了統(tǒng)一的視覺語言大模型 ——Chat-UniVi。通過構(gòu)建圖片和視頻統(tǒng)一表征，該框架使得一個 LLM 能...

閱讀原文

AIGC動態(tài)

2年前 (2023)

視頻生成新突破：PixelDance，輕松呈現(xiàn)復(fù)雜動作與炫酷特效

機器之心報道機器之心編輯部AI 生成的視頻終于能動了。最近，除了大語言模型繼續(xù)持續(xù)刷屏，視頻生成技術(shù)也取得了重大進展，多家公司相繼發(fā)布了新模型。首先，...

閱讀原文

AIGC動態(tài)

2年前 (2023)

提前對齊，視頻問答新SOTA！北大全新Video-LLaVA視覺語言大模型，秒懂視頻笑點

新智元報道編輯：好困【新智元導(dǎo)讀】最近，來自北京大學(xué)等機構(gòu)研究者提出了一種全新視覺語言大模型——Video-LLaVA，使得LLM能夠同時接收圖片和視頻為輸入。Vid...

閱讀原文

AIGC動態(tài)

2年前 (2023)

真正實現(xiàn)一步文生圖，谷歌UFOGen極速采樣，生成高質(zhì)量圖像

機器之心專欄機器之心編輯部最近一年來，以 Stable Diffusion 為代表的一系列文生圖擴散模型徹底改變了視覺創(chuàng)作領(lǐng)域。數(shù)不清的用戶通過擴散模型產(chǎn)生的圖片提...

閱讀原文

AIGC動態(tài)

2年前 (2023)

對標(biāo) Switch，升級擠牙膏，這臺剛更新的掌機背刺老玩家了嗎

掌機的緩慢前行10 號凌晨的一條游戲主機新聞，引起了兩撥人的叫喊。Steam Deck OLED 官宣新聞. 圖片來自：theverge.com游戲公司 Valve 在官網(wǎng)推出了全新 Stea...

閱讀原文

AIGC動態(tài)

2年前 (2023)

DALL·E 3=Midjourney+PS？OpenAI悄悄推出「種子」功能，生圖之后還能精修

新智元報道編輯：潤【新智元導(dǎo)讀】OpenAI又再暗暗更新了，新推出的種子功能可以讓用戶精修自己生成的圖片，添加元素，改變視角，調(diào)光修色都沒問題！今天網(wǎng)上...

閱讀原文

AIGC動態(tài)

2年前 (2023)

更高清寫實的人體生成模型HyperHuman來了，基于隱式結(jié)構(gòu)擴散，刷新多項SOTA

機器之心專欄作者：Snap研究院，香港中文大學(xué)，香港大學(xué)，南洋理工大學(xué)論文地址: https://arxiv.org/pdf/2310.08579.pdfGithub 地址: https://github.com/sna...

閱讀原文

AIGC動態(tài)

2年前 (2023)

Midjourney重大升級，網(wǎng)頁版正式上線！生成圖像真實清晰

新智元報道編輯：貝果【新智元導(dǎo)讀】AI圖像Midjourney進行了重大更新，將其服務(wù)完全遷移到瀏覽器上，以提供更多功能和改善用戶體驗。就在昨天，AI圖像Midjour...

閱讀原文

AIGC動態(tài)

2年前 (2023)

GPT-4和DALL·E 3徹底懵逼，這到底是「牛」還是「鯊」

夕小瑤科技說原創(chuàng)作者 | 付奶茶、王二狗大離譜！我用GPT-4(V)和DALL·E 3 「混合雙打」之下，生成了一張張牛鯊??圖，那么問題來了，這到底是牛還是鯊？起因...

閱讀原文

AIGC動態(tài)

2年前 (2023)

GPT-4V被曝離譜bug：突然執(zhí)行神秘代碼，空白圖片讀出打折信息，網(wǎng)友們都看呆了

豐色明敏發(fā)自凹非寺量子位 | 公眾號 QbitAIGPT-4V出現(xiàn)驚天bug？！原本只是讓它分析一張圖片，結(jié)果它直接犯了致命安全問題，把聊天記錄都給抖落出來了。只...

閱讀原文

AIGC動態(tài)

2年前 (2023)

千萬人圍觀「燒焦嬰兒」圖片！伯克利教授辟謠：AI圖片檢測器無用

新智元報道編輯：桃子潤【新智元導(dǎo)讀】AI無法打敗AI，不是沒有道理。近來，上千萬人圍觀的嬰兒死亡照片，AI檢測工具竟無法給出一致答案。AI圖片檢測器又被沖...

閱讀原文

AIGC動態(tài)

2年前 (2023)

NeurIPS 2023 Spotlight｜高質(zhì)量多視角圖像生成，完美復(fù)刻場景材質(zhì)！SFU等提出MVDiffusion

新智元報道編輯：LRS 好困【新智元導(dǎo)讀】不怕多視角圖像變化大，MVDiffusion整合圖片全局意識，內(nèi)容一致性更高！逼真的圖像生成在虛擬現(xiàn)實、增強現(xiàn)實、視頻游...

閱讀原文

AIGC動態(tài)

2年前 (2023)

手把手教你用AI制作國慶節(jié)微信紅包封面，詳細(xì)教程來了！

在數(shù)字化時代，微信紅包已經(jīng)成為了人們之間交流、互動的一種新方式。而微信紅包封面更是為其賦予了更多個性化、定制化的可能。那么，如何制作一款屬于自己的...

閱讀原文

AIGC動態(tài)

2年前 (2023)

1…3 456