AI項目和框架
InternVLA-A1
InternVLA-A1 是上海人工智能實驗室和國家地方共建人形機器人創新中心聯合發布的具身操作大模型。具備理解、想象、執行一體化的能力,能精準地完成任務。模型...
InternVLA·N1
InternVLA·N1是上海人工智能實驗室開源的端到端雙系統導航大模型。采用雙系統架構,系統2負責理解語言指令并規劃長程路徑,系統1專注于高頻響應和敏捷避障。...
MCP Registry
MCP Registry 是 GitHub 推出的中心化平臺,為開發者提供集中發現和安裝 MCP 服務器。平臺解決以往 MCP 服務器分散在多個注冊中心、隨機倉庫和社區討論中的問...
WebResearcher
WebResearcher是阿里巴巴自通義實驗室推出的迭代式深度研究智能體,隸屬通義DeepResearch家族,基于創新的迭代深度研究范式,模擬人類專家的認知工作流程,能...
通義DeepResearch
通義DeepResearch 是阿里巴巴推出的開源深度研究智能體,專為長周期、深度信息檢索任務設計。擁有 300 億參數,每次激活 30 億參數,支持 ReAct 模式和深度模...
InternVLA·M1
InternVLA·M1 是上海人工智能實驗室開發的具身操作“大腦”,是面向指令跟隨的雙系統操作大模型。構建了覆蓋“思考-行動-自主學習”的完整閉環,負責高階的空間推...
PromptEnhancer
PromptEnhancer是騰訊混元團隊開源的用在提升文本到圖像(T2I)模型的提示重寫框架,通過思維鏈(Chain-of-Thought,CoT)提示重寫和專用的獎勵模型AlignEval...
Nano Bananary
Nano Bananary(香蕉超市) 是開源的圖像編輯工具,基于 Google Gemini 圖像模型開發,支持中文界面和明暗主題切換,提供 50 多種圖像轉換效果,無需復雜提示...
InfiniteTalk
InfiniteTalk是美團視覺智能部推出的新型數字人驅動技術,通過稀疏幀video dubbing范式,僅需少量關鍵幀能驅動數字人人生成自然流暢的視頻,解決傳統技術中口...