AI項目和框架
Matryoshka Diffusion Models
Matryoshka Diffusion Models(MDM)是蘋果公司推出的一種創新的擴散模型,主要用于生成高分辨率圖像和視頻。MDM通過多分辨率擴散過程,在不同尺度上同時進行...
Inverse Painting
Inverse Painting 是一種AI技術,由華盛頓大學的研究人員推出,能逆向重現繪畫過程。通過分析藝術家的繪畫視頻,學習繪畫技巧和順序,然后生成一系列繪畫指令...
Playground v3
Playground v3(PGv3)是由Playground Research推出的最新文本到圖像模型,基于深度融合的大型語言模型(LLM)技術,實現在圖形設計任務上超越人類設計師的能...
Reverb ASR
Reverb ASR是Rev公司推出的開源自動語音識別和說話人分離模型,基于20萬小時的人工轉錄英語數據訓練而成。模型在長語音識別領域表現卓越,適合處理如播客和財...
Open NotebookLM
Open NotebookLM 是一個開源的AI工具,基于最新的開源AI模型,如Llama 3.1 405B、MeloTTS和Bark,將PDF文檔轉換成播客形式的音頻內容。工具適合將書面信息轉...
StoryDiffusion
StoryDiffusion是一個先進的AI圖像和視頻生成框架,用于從文本描述生成具有一致性的圖像和視頻序列。基于Consistent Self-Attention機制增強圖像間的一致性,...
LosslessCut
LosslessCut是一款開源的視頻編輯工具,用于快速且無損地剪切和合并視頻和音頻文件。基于強大的FFmpeg庫構建,提供一個直觀的圖形用戶界面,用戶輕松地進行剪...
Future You
Future You是麻省理工學院(MIT)推出的AI對話聊天產品,支持用戶與60歲時的虛擬形象進行互動對話。Future You基于先進的AI技術,結合用戶當前的生活目標和個...
粵公網安備 44011502001135號