AI項目和框架
MultiAgentPPT
MultiAgentPPT 是多智能體演示文稿生成系統,基于 A2A(Ask-to-Answer)、MCP(Multi-agent Control Protocol)和 ADK(Agent Development Kit)架構。MultiA...
Kling-Foley
Kling-Foley 是可靈 AI 推出的多模態視頻生音效模型。模型將視頻和文本提示作為條件輸入,能生成與視頻內容語義相關、時間同步的高質量立體聲音頻,涵蓋音效...
Nanonets-OCR-s
Nanonets-OCR-s(Nanonets OCR Small)是Nanonets推出的圖像到 Markdown 的 OCR 模型,支持將圖像中的文檔內容轉換為結構化的 Markdown 格式。模型能提取文本...
Kwai Keye-VL
Kwai Keye-VL 是快手自主研發的多模態大語言模型,基于 Qwen3-8B 語言模型整合SigLIP初始化的視覺編碼器,支持動態分辨率輸入。模型能深度融合和處理文本、圖...
Gemini CLI
Gemini CLI 是谷歌開源的 AI Agent,將 Gemini 大模型融入開發者終端。Gemini CLI提供強大 AI 功能,如代碼理解、文件操作、命令執行及動態排查問題,助力開...
AlphaGenome
AlphaGenome是谷歌DeepMind推出的全新AI模型,能更深入地理解基因組。模型能接收長達100萬個堿基對的DNA序列輸入,預測數千種表征其調控活性的分子特性,評估...
DAMO GRAPE
DAMO GRAPE是浙江省腫瘤醫院與阿里巴巴達摩院聯合推出的全球首個基于平掃CT識別早期胃癌的AI模型。DAMO GRAPE突破傳統影像學限制,基于深度學習分析非增強CT...
AnimaTensor
AnimaTensor是CagliostroLab團隊和TensorArt共同推出的二次元圖像生成模型。基于創新的V-Prediction技術,用預測圖像生成過程中的“速度”優化噪聲調度和采樣策...