標簽:圖像

一張圖即出AI視頻!谷歌全新擴散模型,讓人物動起來

新智元報道編輯:alan 【新智元導讀】近日,來自谷歌的研究人員發布了多模態擴散模型VLOGGER,只需一張照片,和一段音頻,就能直接生成人物說話的視頻!只需...
閱讀原文

微軟亞研院新作:讓大模型一口氣調用數百萬個API!

金磊 整理自 凹非寺量子位 | 公眾號 QbitAI近年來,人工智能發展迅速,尤其是像ChatGPT這樣的基礎大模型,在對話、上下文理解和代碼生成等方面表現出色,能夠...
閱讀原文

Sora 在英偉達 H100 上生成 1 分鐘視頻約需 12 分鐘

點擊上方藍字關注我們“Sora模型的成本: Sora的訓練需要大量的計算資源,估計需要4211-10528個 Nvidia H100 GPUs運行一個月。 推理成本:一個Nvidia H100 GPU...
閱讀原文

擴散模型進軍專業圖層,斯坦福提出LayerDiffuse實現分層擴散,效果直逼商業網站

大數據文摘受權轉載自將門創投 目前,視覺擴散生成模型(如Stable Diffusion等)在常規圖像生成任務上獲得了非常好的效果,但是在內容制作的專業領域,例如對...
閱讀原文

通用文檔理解新SOTA,多模態大模型TextMonkey來了

機器之心專欄 機器之心編輯部最近,華中科技大學和金山的研究人員在多模態大模型 Monkey [1](Li et al., CVPR2024)工作的基礎上提出 TextMonkey。在多個場...
閱讀原文

復刻Sora的通用視頻生成能力,開源多智能體框架Mora來了

機器之心專欄 機器之心編輯部何愷明的目標是:探索面向復雜世界的智能。Sora 是首個引起社會廣泛關注的大規模通用視頻生成模型。自 OpenAI 在 2024 年 2 月推...
閱讀原文

升級!Sora漫步街頭的女人可以跳舞啦!科目三蹦迪多種舞姿停不下來,可精準控制動作

夕小瑤科技說 原創作者 | 付奶茶Sora為我們展開了一個充滿驚喜的新篇章,同時,Viggle這一模型也吸引了公眾的目光,并在推特上迅速走紅! 想象一個場景,你僅...
閱讀原文

微軟新作「Mora」,復原了Sora

夕小瑤科技說 分享來源 | 新智元微軟版Sora誕生了! Sora雖爆火但閉源,給學術界帶來了不小的挑戰。學者們只能嘗試使用逆向工程來對Sora復現或擴展。盡管提出...
閱讀原文

Sora復刻版來了,微軟參與,華人團隊打造

白交 發自 凹非寺量子位 | 公眾號 QbitAISora復刻版出現了—— Mora,還是多智能體那種。 △Mora:模擬數字世界Sora有的能力它基本都有,比如文本轉視頻、擴展視...
閱讀原文

Sora不開源,微軟給你開源!全球最接近Sora視頻模型誕生,12秒生成效果逼真炸裂

新智元報道編輯:編輯部 【新智元導讀】用不了多久,開源版的Sora就會涌來!理海大學微軟團隊已經做出一種全新多AI智能體框架Mora,可以完全復刻Sora能力,且...
閱讀原文

發完最后一篇論文,Stable Diffusion核心團隊全要離職了

機器之心報道 機器之心編輯部內部核心員工出走頻繁,外部投資者不斷喪失信心,成立于 2019 年的 AI 初創公司 Stability AI 還能推出偉大的產品嗎? 離 Stable...
閱讀原文

每周編輯精選|在線運行 Deepmoney 金融大模型、AI 偏好等多個優質數據集上線

目前,AI 領域對金融模型的研究成果大多是基于公共知識進行訓練的,但在實際的金融實踐中,這些公共知識對于當前市場的可解釋性往往嚴重不足。一個理想的金融...
閱讀原文

CMU朱俊彥、Adobe新作:512×512圖像推理,A100只用0.11秒

機器之心報道 編輯:陳萍、杜偉可玩性極強!簡筆素描一鍵變身多風格畫作,還能添加額外的描述,這在 CMU、Adobe 聯合推出的一項研究中實現了。 作者之一為 CM...
閱讀原文

Stable Video 3D震撼上線,視頻擴散模型史詩級提升!4090可跑,權重已開放

新智元報道編輯:alan 【新智元導讀】近日,Stability AI又發布了新作SV3D,基于視頻擴散模型的SV3D將3D模型生成的效果提升了一大截,模型權重已在huggingfac...
閱讀原文

3D重建范式變革!最新模型MVDiffusion++:無需相機姿態,即可實現高清3D模型重建

新智元報道編輯:LRS 【新智元導讀】受人類視覺系統的啟發,MVDiffusion++結合計算方法高保真和人類視覺系統靈活性,可以根據任意數量的無位姿圖片, 生成密...
閱讀原文
1222324252648