標簽:圖像
《古墓麗影》初代勞拉,“真人”原來長這樣
克雷西 蕭簫 發自 凹非寺量子位 | 公眾號 QbitAI用AI把經典老游戲“重畫一遍”,這個愿望如今可能真的要實現了。PS 1《古墓麗影》中的像素風勞拉,讓AI上手改畫...
任意文本、視覺、音頻混合生成,多模態有了強大的基礎引擎CoDi-2
機器之心報道編輯:杜偉、大盤雞研究者表示,CoDi-2 標志著在開發全面的多模態基礎模型領域取得了重大突破。今年 5 月,北卡羅來納大學教堂山分校、微軟提出...
全網都在模仿的「科目三」,梅西、鋼鐵俠、二次元姐馬上拿下
機器之心報道機器之心編輯部來自阿里的研究團隊提出了一種名為 Animate Anyone 的方法,只需一張人物照片,再配合骨骼動畫引導,就能生成動畫視頻。最近一段...
SDXL Turbo、LCM相繼發布,AI畫圖進入實時生成時代:字打多快,出圖就有多快
機器之心報道機器之心編輯部使用一塊 A100,出圖的延遲只有 200 毫秒。本周二,Stability AI 推出了新一代圖像合成模型 Stable Diffusion XL Turbo,引發了一...
太可怕了!AI虛假圖片已經達到了新聞攝影獲獎的程度…
夕小瑤科技說 原創作者 | 楊燦首先請大家看一副入圍新聞攝影獲獎的作品:戰爭期間,一名受傷的以色列年輕女子正痛苦地抓著士兵的手臂。這抓拍的角度,這女子...
超越同級7B模型! 中國團隊開源大規模高質量圖文數據集ShareGPT4V,大幅提升多模態性能
新智元報道編輯:LRS【新智元導讀】研究人員利用GPT4-Vision構建了一個大規模高質量圖文數據集ShareGPT4V,并在此基礎上訓練了一個7B模型,在多項多模態榜單...
ChatGPT提示詞新玩法「make it more」,文生圖效果翻倍
機器之心報道編輯:杜偉一個非常好用的 ChatGPT 提示詞技巧。ChatGPT 想來大家都不陌生了,但如何用好它卻沒有想象中的那么容易。尤其是在文生圖任務中,提示...
我的眼睛就是尺!80億參數OtterHD帶你「清明上河圖」數駱駝!南洋理工華人團隊打造
新智元報道編輯:好困【新智元導讀】最近,由南洋理工華人團隊新提出的80億參數多模態大模型OtterHD,不僅可以搞定讓GPT-4V都發愁的難題,甚至還可以數出來《...
單個A100生成3D圖像只需30秒,這是Adobe讓文本、圖像都動起來的新方法
機器之心報道編輯:杜偉、佳琪3D 生成是 AI 視覺領域的研究熱點之一。本文中,來自 Adobe 研究院和斯坦福大學等機構的研究者利用基于 transformer 的 3D 大型...
文生圖10倍速,視頻實時渲染!清華發布LCM:兼容全部SD大模型、LoRA、插件等
新智元報道作者:譚煒達編輯:LRS 好困【新智元導讀】全面兼容Stable Diffusion生態,LCM模型成功實現5-10倍生成速度的提升,實時AI藝術時代即將到來,所想即...
Stable Video Diffusion來了,代碼權重已上線
機器之心報道機器之心編輯部Stability AI 的視頻生成模型看來效果不錯。AI 畫圖的著名公司 Stability AI,終于入局 AI 生成視頻了。本周二,基于 Stable Diff...
文生圖大型實踐:揭秘百度搜索 AIGC 繪畫工具的背后故事!
嘉賓 | 魚哲、TianBao編輯 | Tina自從進入 2023 年以來,AIGC 技術已催生了新一輪人工智能浪潮。AI 繪畫作為大模型最引人矚目的應用領域之一,近年來也取得了...
GPT-4V醫學執照考試成績超過大部分醫學生,AI加入臨床還有多遠?
機器之心專欄機器之心編輯部人工智能(AI)在醫學影像診斷方面的應用已經有了長足的進步。然而,在未經嚴格測試的情況下,醫生往往難以采信人工智能的診斷結...
GPT-4V在自動駕駛上應用前景如何?面向真實場景的全面測評來了
機器之心報道機器之心編輯部GPT-4V 的發布讓許多計算機視覺(CV)應用看到了新的可能。一些研究人員開始探索 GPT-4V 的實際應用潛力。最近,一篇題為《On the...
效果超越SDXL!港中大博士生推出超真實人像合成工具,訓練用了3.4億張圖
克雷西 發自 凹非寺量子位 | 公眾號 QbitAI為了讓AI畫出的人更加逼真,港中大博士生用了3.4億張圖像專門訓練畫人。人物的表情、姿態,環境的空間關系、光線都...