AI項目和框架
Kandinsky 5.0
Kandinsky 5.0 是俄羅斯 AI 研究實驗室 AI-Forever 開發的文本到視頻生成模型,具有強大的生成能力和高效的性能表現。核心版本 Kandinsky 5.0 Video Lite 是...
MAI-Image-1
MAI-Image-1是微軟推出的首款自研圖像生成式AI模型。模型以“創作者導向”為核心設計理念,擅長生成逼真的自然光照效果和復雜場景圖像,如閃電、風景等。與一些...
Youtu-Embedding
Youtu-Embedding 是騰訊優圖實驗室開源的面向企業級應用的通用文本表示模型。模型通過大規模語料訓練和創新的微調框架,具備強大的語義理解能力,能勝任文本...
LLaVA-OneVision-1.5
LLaVA-OneVision-1.5 是開源的多模態模型,通過高效訓練和高質量數據實現高性能、低成本和強復現性。采用自研的 RICE-ViT 作為視覺編碼器,結合 2D 旋轉位置...
MineContext
MineContext 是字節跳動開源的主動式上下文感知 AI 工具,通過挖掘數字生活中的“方塊”,幫助用戶高效管理知識和信息。每 5 秒截取一次屏幕,經過處理后,批量...
NeuTTS Air
NeuTTS Air 是 Neuphonic 開發的超擬真、可離線運行的 TTS(文本到語音)模型。具備高擬真語音合成能力,聲音自然流暢,幾乎能以假亂真。支持本地運行,提供 ...
Paper2Video
Paper2Video 是新加坡國立大學 Show Lab 開發的項目,從學術論文自動生成演示視頻。通過 PaperTalker 多智能體框架,將論文轉化為包含幻燈片、字幕、語音和演...
Qwen3-VL Cookbooks
Qwen3-VL Cookbooks 是阿里推出的為 Qwen3-VL 模型設計的實用指南集合,幫助用戶快速掌握和應用該模型的各種功能。集合涵蓋多種能力的使用示例,包括物體識別...
Androidify
Androidify 是谷歌推出的一個開源項目,幫助開發者學習如何在 Android 上構建 AI 驅動的應用。項目使用了谷歌最新的技術,如 Jetpack Compose、Gemini API(...
粵公網安備 44011502001135號