AI項目和框架

Kandinsky 5.0

Kandinsky 5.0 是俄羅斯 AI 研究實驗室 AI-Forever 開發的文本到視頻生成模型,具有強大的生成能力和高效的性能表現。核心版本 Kandinsky 5.0 Video Lite 是...
閱讀原文

SongBloom

SongBloom 是騰訊 AI Lab 開發的全長度歌曲生成框架,結合了自回歸草圖繪制和基于擴散的細化技術,通過交錯生成范式(Interleaved Generation)交替生成語義...
閱讀原文

MAI-Image-1

MAI-Image-1是微軟推出的首款自研圖像生成式AI模型。模型以“創作者導向”為核心設計理念,擅長生成逼真的自然光照效果和復雜場景圖像,如閃電、風景等。與一些...
閱讀原文

Youtu-Embedding

Youtu-Embedding 是騰訊優圖實驗室開源的面向企業級應用的通用文本表示模型。模型通過大規模語料訓練和創新的微調框架,具備強大的語義理解能力,能勝任文本...
閱讀原文

Ring-1T

Ring-1T是螞蟻集團開源的萬億參數思考大模型,基于 Ling 2.0 MoE 架構,在 20T 語料上預訓練,通過自研強化學習系統 ASystem 進行推理能力訓練。支持128k上下...
閱讀原文

SAIL-VL2

SAIL-VL2 是抖音團隊和新加坡國立大學聯合開發的開源視覺語言基礎模型,專注于多模態理解和推理。由視覺編碼器 SAIL-ViT、視覺-語言適配器和大語言模型組成,...
閱讀原文

nanochat

nanochat是AI領域專家Andrej Karpathy發布的開源項目,以極低成本和高效流程訓練小型語言模型,實現類似ChatGPT的對話功能。僅需約100美元(使用8張H100 GPU...
閱讀原文

Get Jobs

Get Jobs是開源的自動化簡歷投遞工具,能幫助用戶高效地在多個招聘平臺(如Boss直聘、獵聘、拉勾、51job、智聯招聘等)上投遞簡歷。
閱讀原文

LLaVA-OneVision-1.5

LLaVA-OneVision-1.5 是開源的多模態模型,通過高效訓練和高質量數據實現高性能、低成本和強復現性。采用自研的 RICE-ViT 作為視覺編碼器,結合 2D 旋轉位置...
閱讀原文

MineContext

MineContext 是字節跳動開源的主動式上下文感知 AI 工具,通過挖掘數字生活中的“方塊”,幫助用戶高效管理知識和信息。每 5 秒截取一次屏幕,經過處理后,批量...
閱讀原文

NeuTTS Air

NeuTTS Air 是 Neuphonic 開發的超擬真、可離線運行的 TTS(文本到語音)模型。具備高擬真語音合成能力,聲音自然流暢,幾乎能以假亂真。支持本地運行,提供 ...
閱讀原文

Paper2Video

Paper2Video 是新加坡國立大學 Show Lab 開發的項目,從學術論文自動生成演示視頻。通過 PaperTalker 多智能體框架,將論文轉化為包含幻燈片、字幕、語音和演...
閱讀原文

KAT-Dev-72B-Exp

KAT-Dev-72B-Exp 是快手推出的開源編程專用大語言模型,參數規模達720億。模型是 KAT-Coder 的強化學習版本,專為軟件工程任務設計。
閱讀原文

Qwen3-VL Cookbooks

Qwen3-VL Cookbooks 是阿里推出的為 Qwen3-VL 模型設計的實用指南集合,幫助用戶快速掌握和應用該模型的各種功能。集合涵蓋多種能力的使用示例,包括物體識別...
閱讀原文

Androidify

Androidify 是谷歌推出的一個開源項目,幫助開發者學習如何在 Android 上構建 AI 驅動的應用。項目使用了谷歌最新的技術,如 Jetpack Compose、Gemini API(...
閱讀原文
145678154