AI項目和框架

MoE++

MoE++是一種新型的混合專家(Mixture-of-Experts)架構,由昆侖萬維2050研究院與北大袁粒團隊聯合推出。基于引入零計算量專家,即零專家、復制專家和常數專家...
閱讀原文

Granite 3.0

Granite 3.0 是 IBM 推出的一系列先進的AI模型,能在多個學術和企業基準測試中展現出卓越的性能。模型設計用在企業級應用,能執行各種任務,包括文本生成、分...
閱讀原文

Project Turntable

Project Turntable是Adobe在2024年MAX大會上推出的一款創新AI工具。工具能讓用戶像操作3D對象一樣旋轉2D矢量圖像,即時生成圖像所需的隱藏部分。用AI模型填充...
閱讀原文

OmniAI

OmniAI是一個強大的AI文檔處理平臺,基于先進的OCR技術,支持對PDF、DOCX、圖片等多種文件格式進行快速處理和數據提取。平臺支持用戶輕松創建文檔處理管道,...
閱讀原文

TaskWeaver

TaskWeaver是由微軟推出的一個代碼優先的AI智能體框架,專注于無縫規劃和執行數據分析任務。基于代碼片段解釋用戶請求,高效協調各種插件(以函數形式)執行...
閱讀原文

Stable Diffusion 3.5

Stable Diffusion 3.5是Stability AI公司最新推出的一系列先進的AI圖像生成模型,包括Stable Diffusion 3.5 Large、Stable Diffusion 3.5 Large Turbo和即將...
閱讀原文

Mochi 1

Mochi 1是Genmo公司推出的開源視頻生成模型,在動作質量和遵循用戶提示方面表現出色。Mochi 1基于Apache 2.0許可證發布,支持個人和商業用途的免費使用。模型...
閱讀原文

Claude 3.5 Haiku

Claude 3.5 Haiku 是 Anthropic 公司推出的一款新型人工智能模型,保持與前代 Claude 3 Haiku 相近的速度和成本的同時,實現了在各項能力上的提升,在多項基...
閱讀原文

PUMA

PUMA是一個先進的多模態大型語言模型(MLLM),旨在基于集成多粒度視覺特征統一和增強視覺生成和理解任務。PUMA能處理從文本到圖像的生成、詳細的圖像編輯及...
閱讀原文

Janus

Janus是一個由DeepSeek AI推出的自回歸框架,旨在統一多模態理解和生成任務。將視覺編碼分離成不同的路徑解決以往方法的局限性,且用單一的變換器架構進行處...
閱讀原文

PaddleOCR 2.9

PaddleOCR 2.9是由百度飛槳(PaddlePaddle)推出的一款開源光學字符識別(OCR)工具庫。提供豐富的算法和模型,支持多種語言識別,提供數據標注和合成工具。P...
閱讀原文

Mellum

Mellum 是 JetBrains 推出的一款專為開發者設計的大型語言模型(LLM),旨在提升 AI 驅動的開發工具。通過深度集成 JetBrains IDE,提供低延遲、高準確度的代...
閱讀原文

easegen

easegen是一個開源的AI+數字人課程制作項目,集成課程制作、視頻管理、智能課件生成到智能出題的全套方案。項目支持PPT課件的批量自動生成、數字人克隆、聲音...
閱讀原文

sCM

sCM是OpenAI推出的連續時間一致性模型,基于擴散模型原理進行改進。sCM簡化理論框架和優化采樣過程,實現圖像生成速度的顯著提升。sCM模型僅需兩步采樣能生成...
閱讀原文

Moonshine

Moonshine是專為資源受限設備優化的語音識別模型,提供快速且準確的實時語音轉文本服務。適于需要即時響應的應用場景,例如現場轉錄和語音命令識別。Moonshin...
閱讀原文