標簽：圖像

一張圖即出AI視頻！谷歌全新擴散模型，讓人物動起來

新智元報道編輯：alan 【新智元導讀】近日，來自谷歌的研究人員發布了多模態擴散模型VLOGGER，只需一張照片，和一段音頻，就能直接生成人物說話的視頻！只需...

閱讀原文

AIGC動態

2年前 (2024)

微軟亞研院新作：讓大模型一口氣調用數百萬個API！

金磊整理自凹非寺量子位 | 公眾號 QbitAI近年來，人工智能發展迅速，尤其是像ChatGPT這樣的基礎大模型，在對話、上下文理解和代碼生成等方面表現出色，能夠...

閱讀原文

AIGC動態

2年前 (2024)

Sora 在英偉達 H100 上生成 1 分鐘視頻約需 12 分鐘

點擊上方藍字關注我們“Sora模型的成本： Sora的訓練需要大量的計算資源，估計需要4211-10528個 Nvidia H100 GPUs運行一個月。推理成本：一個Nvidia H100 GPU...

閱讀原文

AIGC動態

2年前 (2024)

擴散模型進軍專業圖層，斯坦福提出LayerDiffuse實現分層擴散，效果直逼商業網站

大數據文摘受權轉載自將門創投目前，視覺擴散生成模型（如Stable Diffusion等）在常規圖像生成任務上獲得了非常好的效果，但是在內容制作的專業領域，例如對...

閱讀原文

AIGC動態

2年前 (2024)

通用文檔理解新SOTA，多模態大模型TextMonkey來了

機器之心專欄機器之心編輯部最近，華中科技大學和金山的研究人員在多模態大模型 Monkey [1]（Li et al., CVPR2024）工作的基礎上提出 TextMonkey。在多個場...

閱讀原文

AIGC動態

2年前 (2024)

復刻Sora的通用視頻生成能力，開源多智能體框架Mora來了

機器之心專欄機器之心編輯部何愷明的目標是：探索面向復雜世界的智能。Sora 是首個引起社會廣泛關注的大規模通用視頻生成模型。自 OpenAI 在 2024 年 2 月推...

閱讀原文

AIGC動態

2年前 (2024)

升級！Sora漫步街頭的女人可以跳舞啦！科目三蹦迪多種舞姿停不下來，可精準控制動作

夕小瑤科技說原創作者 | 付奶茶Sora為我們展開了一個充滿驚喜的新篇章，同時，Viggle這一模型也吸引了公眾的目光，并在推特上迅速走紅！想象一個場景，你僅...

閱讀原文

AIGC動態

2年前 (2024)

微軟新作「Mora」，復原了Sora

夕小瑤科技說分享來源 | 新智元微軟版Sora誕生了！ Sora雖爆火但閉源，給學術界帶來了不小的挑戰。學者們只能嘗試使用逆向工程來對Sora復現或擴展。盡管提出...

閱讀原文

AIGC動態

2年前 (2024)

Sora復刻版來了，微軟參與，華人團隊打造

白交發自凹非寺量子位 | 公眾號 QbitAISora復刻版出現了—— Mora，還是多智能體那種。 △Mora：模擬數字世界Sora有的能力它基本都有，比如文本轉視頻、擴展視...

閱讀原文

AIGC動態

2年前 (2024)

Sora不開源，微軟給你開源！全球最接近Sora視頻模型誕生，12秒生成效果逼真炸裂

新智元報道編輯：編輯部【新智元導讀】用不了多久，開源版的Sora就會涌來！理海大學微軟團隊已經做出一種全新多AI智能體框架Mora，可以完全復刻Sora能力，且...

閱讀原文

AIGC動態

2年前 (2024)

發完最后一篇論文，Stable Diffusion核心團隊全要離職了

機器之心報道機器之心編輯部內部核心員工出走頻繁，外部投資者不斷喪失信心，成立于 2019 年的 AI 初創公司 Stability AI 還能推出偉大的產品嗎？離 Stable...

閱讀原文

AIGC動態

2年前 (2024)

每周編輯精選｜在線運行 Deepmoney 金融大模型、AI 偏好等多個優質數據集上線

目前，AI 領域對金融模型的研究成果大多是基于公共知識進行訓練的，但在實際的金融實踐中，這些公共知識對于當前市場的可解釋性往往嚴重不足。一個理想的金融...

閱讀原文

AIGC動態

2年前 (2024)

CMU朱俊彥、Adobe新作：512×512圖像推理，A100只用0.11秒

機器之心報道編輯：陳萍、杜偉可玩性極強！簡筆素描一鍵變身多風格畫作，還能添加額外的描述，這在 CMU、Adobe 聯合推出的一項研究中實現了。作者之一為 CM...

閱讀原文

AIGC動態

2年前 (2024)

Stable Video 3D震撼上線，視頻擴散模型史詩級提升！4090可跑，權重已開放

新智元報道編輯：alan 【新智元導讀】近日，Stability AI又發布了新作SV3D，基于視頻擴散模型的SV3D將3D模型生成的效果提升了一大截，模型權重已在huggingfac...

閱讀原文

AIGC動態

2年前 (2024)

3D重建范式變革！最新模型MVDiffusion++：無需相機姿態，即可實現高清3D模型重建

新智元報道編輯：LRS 【新智元導讀】受人類視覺系統的啟發，MVDiffusion++結合計算方法高保真和人類視覺系統靈活性，可以根據任意數量的無位姿圖片，生成密...

閱讀原文

AIGC動態

2年前 (2024)

1…22 232425 26…48