AI項目和框架

Matryoshka Diffusion Models

Matryoshka Diffusion Models（MDM）是蘋果公司推出的一種創新的擴散模型，主要用于生成高分辨率圖像和視頻。MDM通過多分辨率擴散過程，在不同尺度上同時進行...

閱讀原文

AI工具

1年前 (2024)

IFAdapter

IFAdapter是一種新型的文本到圖像生成模型，由騰訊和新加坡國立大學共同推出。提升生成含有多個實例的圖像時的位置和特征準確性。傳統模型在處理多實例圖像時...

閱讀原文

AI工具

1年前 (2024)

TinyVLA

TinyVLA是一種面向機器人操控的視覺-語言-動作（VLA）模型，由華東師范大學和上海大學團隊推出。針對現有VLA模型的不足，如推理速度慢和需要大量數據預訓練，...

閱讀原文

AI工具

1年前 (2024)

Inverse Painting

Inverse Painting 是一種AI技術，由華盛頓大學的研究人員推出，能逆向重現繪畫過程。通過分析藝術家的繪畫視頻，學習繪畫技巧和順序，然后生成一系列繪畫指令...

閱讀原文

AI工具

1年前 (2024)

Playground v3

Playground v3（PGv3）是由Playground Research推出的最新文本到圖像模型，基于深度融合的大型語言模型（LLM）技術，實現在圖形設計任務上超越人類設計師的能...

閱讀原文

AI工具

1年前 (2024)

Reverb ASR

Reverb ASR是Rev公司推出的開源自動語音識別和說話人分離模型，基于20萬小時的人工轉錄英語數據訓練而成。模型在長語音識別領域表現卓越，適合處理如播客和財...

閱讀原文

AI工具

1年前 (2024)

Open NotebookLM

Open NotebookLM 是一個開源的AI工具，基于最新的開源AI模型，如Llama 3.1 405B、MeloTTS和Bark，將PDF文檔轉換成播客形式的音頻內容。工具適合將書面信息轉...

閱讀原文

AI工具

1年前 (2024)

StoryDiffusion

StoryDiffusion是一個先進的AI圖像和視頻生成框架，用于從文本描述生成具有一致性的圖像和視頻序列。基于Consistent Self-Attention機制增強圖像間的一致性，...

閱讀原文

AI工具

1年前 (2024)

Crawl4AI

Crawl4AI是一款用 Python 開發的異步爬蟲框架，專為大型語言模型（LLMs）和人工智能（AI）應用設計，簡化網絡爬蟲和數據提取流程。基于異步架構，高效地處理...

閱讀原文

AI工具

1年前 (2024)

Wren AI

Wren AI 是一個開源的文本到 SQL 解決方案，基于自然語言處理技術，支持用戶通過自然語言提問執行數據庫查詢，無需編寫復雜的 SQL 代碼。支持多種數據庫和數...

閱讀原文

AI工具

1年前 (2024)

Podcastfy

Podcastfy 是一個開源的 Python 軟件包，能將網絡內容、PDF 文檔及文本轉換成多語言的音頻對話形式。這款工具采用了先進的生成式人工智能（GenAI）技術，類似...

閱讀原文

AI工具

1年前 (2024)

Gradio

Gradio 是一個開源的 Python 庫，簡化機器學習模型的演示和共享過程。支持開發者基于簡單的代碼快速創建出友好的網頁界面，任何人、任何地點能輕松使用機器學...

閱讀原文

AI工具

1年前 (2024)

LosslessCut

LosslessCut是一款開源的視頻編輯工具，用于快速且無損地剪切和合并視頻和音頻文件。基于強大的FFmpeg庫構建，提供一個直觀的圖形用戶界面，用戶輕松地進行剪...

閱讀原文

AI工具

1年前 (2024)

Future You

Future You是麻省理工學院（MIT）推出的AI對話聊天產品，支持用戶與60歲時的虛擬形象進行互動對話。Future You基于先進的AI技術，結合用戶當前的生活目標和個...

閱讀原文

AI工具

1年前 (2024)

PixWizard

PixWizard是一個多功能的圖像到圖像視覺助手，基于自然語言指令執行圖像生成、編輯和翻譯等任務。系統通過統一的圖像-文本到圖像生成框架，將多種視覺任務整...

閱讀原文

AI工具

1年前 (2024)

1…140 141142143 144…155