AI項目和框架

InternVLA-A1

InternVLA-A1 是上海人工智能實驗室和國家地方共建人形機器人創新中心聯合發布的具身操作大模型。具備理解、想象、執行一體化的能力,能精準地完成任務。模型...
閱讀原文

ReSum

ReSum 是阿里通義推出的新型WebAgent 推理范式,隸屬通義DeepResearch家族,能解決 WebAgent 在長視界任務中面臨的上下文長度限制問題,通過周期性地對交互歷...
閱讀原文

Octofriend

Octofriend 是智能編程助手,能像貼心伙伴一樣在 GPT-5、Claude 等大型語言模型(LLM)間自由切換,根據任務需求挑選最優模型。
閱讀原文

InternVLA·N1

InternVLA·N1是上海人工智能實驗室開源的端到端雙系統導航大模型。采用雙系統架構,系統2負責理解語言指令并規劃長程路徑,系統1專注于高頻響應和敏捷避障。...
閱讀原文

MCP Registry

MCP Registry 是 GitHub 推出的中心化平臺,為開發者提供集中發現和安裝 MCP 服務器。平臺解決以往 MCP 服務器分散在多個注冊中心、隨機倉庫和社區討論中的問...
閱讀原文

WebResearcher

WebResearcher是阿里巴巴自通義實驗室推出的迭代式深度研究智能體,隸屬通義DeepResearch家族,基于創新的迭代深度研究范式,模擬人類專家的認知工作流程,能...
閱讀原文

WebWeaver

WebWeaver 是阿里巴巴通義團隊推出的新型雙智能體框架,隸屬通義DeepResearch家族,用在開放性深度研究。WebWeaver 模擬人類研究過程,將任務分為規劃(探索...
閱讀原文

通義DeepResearch

通義DeepResearch 是阿里巴巴推出的開源深度研究智能體,專為長周期、深度信息檢索任務設計。擁有 300 億參數,每次激活 30 億參數,支持 ReAct 模式和深度模...
閱讀原文

InternVLA·M1

InternVLA·M1 是上海人工智能實驗室開發的具身操作“大腦”,是面向指令跟隨的雙系統操作大模型。構建了覆蓋“思考-行動-自主學習”的完整閉環,負責高階的空間推...
閱讀原文

VLAC

VLAC是上海人工智能實驗室發布的具身獎勵大模型。以InternVL多模態大模型為基礎,融合互聯網視頻數據和機器人操作數據,為機器人在真實世界中的強化學習提供...
閱讀原文

RustGPT

RustGPT 是用 Rust 編寫的 Transformer 架構語言模型。RustGPT從零開始構建,不依賴任何外部機器學習框架,僅用 ndarray 進行矩陣運算。
閱讀原文

PromptEnhancer

PromptEnhancer是騰訊混元團隊開源的用在提升文本到圖像(T2I)模型的提示重寫框架,通過思維鏈(Chain-of-Thought,CoT)提示重寫和專用的獎勵模型AlignEval...
閱讀原文

Nano Bananary

Nano Bananary(香蕉超市) 是開源的圖像編輯工具,基于 Google Gemini 圖像模型開發,支持中文界面和明暗主題切換,提供 50 多種圖像轉換效果,無需復雜提示...
閱讀原文

InfiniteTalk

InfiniteTalk是美團視覺智能部推出的新型數字人驅動技術,通過稀疏幀video dubbing范式,僅需少量關鍵幀能驅動數字人人生成自然流暢的視頻,解決傳統技術中口...
閱讀原文

LLaSO

LLaSO(Large Language and Speech Model)是北京深度邏輯智能科技有限公司推出的全球首個完全開源的語音模型,能解決大型語音語言模型(LSLM)領域長期存在...
閱讀原文
12345145