標簽:圖像生成

Midjourney V1

Midjourney V1 是 Midjourney 公司推出的首個AI視頻生成模型。支持用戶將靜態圖像轉化為動態視頻。用戶上傳圖片或在 Midjourney 中生成圖片基于“Animate”按鈕...
閱讀原文

FloweAI

FloweAI是通用型AI Agent,支持基于自然語言指令高效完成各類任務。FloweAI能快速制作PPT、撰寫文檔、發送郵件、進行深度研究并生成專業報告。
閱讀原文

最新AI項目

AI工具集實時追蹤最新開源與非開源AI項目,為您提供前沿技術動態。涵蓋多模態、推理、生成等熱門領域。無論是企業創新還是開發者探索,這里都是您獲取最新AI...
閱讀原文

LilysAI

LilysAI 是功能強大的 AI 摘要工具,用于快速提取和總結各種格式文件或內容的核心信息。支持多種文件類型,包括視頻、音頻、PDF、Word 文檔、PPT 幻燈片、Exc...
閱讀原文

Next-Frame Diffusion

Next-Frame Diffusion(NFD)是北京大學和微軟研究院聯合推出的自回歸視頻生成模型,結合擴散模型的高保真生成能力和自回歸模型的因果性和可控性。Next-Frame...
閱讀原文

V-JEPA 2

V-JEPA 2 是Meta AI推出的世界大模型,基于視頻數據實現對物理世界的理解、預測和規劃。V-JEPA 2 用于 12 億參數的聯合嵌入預測架構(JEPA),基于自監督學習...
閱讀原文

Tripo Studio

Tripo Studio 是3D 大模型公司 VAST 推出的全球首個 AI 驅動的一站式 3D 工作臺,深度融合了 Tripo 核心算法套件,覆蓋從模型生成、材質貼圖到骨骼綁定的全流...
閱讀原文

Krea 1

Krea 1 是 Krea AI 推出的 AI 圖像生成模型,解決傳統 AI 圖像生成中的“AI 美學”問題。模型能生成高度逼真、紋理清晰的圖像,支持多種藝術風格,提供風格參考...
閱讀原文

SmolVLA

SmolVLA 是 Hugging Face 開源的輕量級視覺-語言-行動(VLA)模型,專為經濟高效的機器人設計。擁有4.5億參數,模型小巧,可在CPU上運行,單個消費級GPU即可...
閱讀原文

dots.llm1

dots.llm1 是小紅書 hi lab 開源的中等規模 Mixture of Experts(MoE)文本大模型,具有 1420 億參數,激活參數為 140 億。模型在 11.2T 高質量 token 數據上...
閱讀原文

Kuse AI

Kuse AI 是基于AI技術與無限畫布提升工作效率的智能工具。Kuse AI 提供無邊界的畫布,用戶能自由組織和呈現信息,支持文本、圖像、PDF、YouTube視頻等多種格...
閱讀原文

Eleven v3

Eleven v3是ElevenLabs推出的先進文本轉語音模型。通過內聯音頻標簽實現情感和語調的精確控制,支持多說話人對話,對話更自然。模型支持超70種語言,文本理解...
閱讀原文

Klic Studio

Klic Studio(原Krillin AI) 是基于大型語言模型(LLMs)的視頻翻譯、配音和語音克隆工具,專為視頻創作者和內容出海者設計。支持一鍵部署全流程,可將視頻...
閱讀原文

PlayDiffusion

PlayDiffusion是PlayAI推出的新型音頻編輯模型,基于擴散模型技術,專門用在音頻的精細編輯和修復。模型將音頻編碼為離散的標記序列,對需要修改的部分進行掩...

DGM

DGM(Darwin G?del Machine)是自改進人工智能系統,通過迭代修改自身代碼來提升性能。DGM從其維護的編碼代理檔案中選擇一個代理,基于基礎模型生成新版本,...
閱讀原文
1234511